Mendeteksi Multikolinearitas - Buku Ajar Ekonometrika FP Anwar

Gejala yang biasanya dipakai untuk menandai adanya multikolinearitas adalah: (a) koefisien determinasi (R2y), (b) koefisien korelasi parsial, dan (c)

kesalahan baku (standar error) dari parameter-parameter regresi. Secara sendiri-sendiri, tidak satupun dari gejala-gejala itu dipakai sebagai indikator yang memuaskan mengenai adanya multikolinearitas, karena (Gunawan, 1995):

1. Kesalahan baku yang besar bisa terjadi karena berbagai sebab, dan tidak hanya karena adanya hubungan-hubungan linier di antara variabel-variabel bebas.

2. Koefisien korelasi parsial yang tinggi hanyalah suatu syarat yang cukup (sufficient condition) tetapi bukan syarat yang perlu (necessary condition) atau bukan kriteria yang tepat bagi adanya multikolinearitas.

3. Koefisien determinasi (R2y) mungkin saja tinggi, namun taksiran-taksiran mungkin tidak signifikan.

Sekalipun demikian, kombinasi dari ketiga kriteria tersebut akan membantu dalam mendeteksi adanya multikolinearitas.

Tidak ada satu pun cara yang paling baik untuk mengetahui gejala multikolinearitas. Salah satu cara yang umum digunakan untuk mendeteksi adanya multikolinearitas adalah apabila nilai R2y sangat tinggi (> 0,70), nilai F- hitung sangat tinggi (signifikan), tetapi tidak satu pun atau sedikit sekali koefisien regresi yang diuji dengan t-student (t-test) yang signifikan. Hal ini menandakan multikolinearitas dalam model cukup serius. Selain itu, apabila koefisien determinasi antara variabel tak bebas dengan semua variabel bebas (R2y,x1,..,xk) lebih kecil daripada koefisien determinasi (R2x1,x2,..,xk) antar variabel bebas yang satu dengan sisanya berarti multikolinearitas dalam model cukup serius. Akibat adanya multikolinearitas ini, maka akan sangat sulit untuk

memisahkan pengaruh masing-masing variabel bebas terhadap variabel tak bebasnya.

Teladan :

Untuk menggambarkan variasi yang ditimbulkan oleh gejala multikolinearitas, berikut ini diajukan data hipotetis hubungan antara pendapatan (X1) dan kekayaan (X2) terhadap pola konsumsi (Y).

Data dikutip dari Gujarati (1995), p 333

No Pola Konsumsi (Y) Pendapatan (X1) Kekayaan (X2)

1 70 80 810 2 65 100 1009 3 90 120 1273 4 95 140 1425 5 110 160 1633 6 115 180 1876 7 120 200 2052 8 140 220 2201 9 155 240 2435 10 150 260 2686

Hasil regresinya dapat dilihat pada tabel berikut.

LS // Dependent Variable is Y Date: 4-02-1997 / Time: 5:20 SMPL range: 1 - 10 Number of observations: 10

================================================================ VARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG. ================================================================

C 24.774733 6.7524996 3.6689722 0.008 X1 0.9415373 0.8228983 1.1441722 0.290 X2 -0.0424345 0.0806645 -0.5260621 0.615 ================================================================ R-squared 0.963504 Mean of dependent var 111.0000 Adjusted R-squared 0.953077 S.D. of dependent var 31.42893 S.E. of regression 6.808041 Sum of squared resid 324.4459 Durbin-Watson stat 2.890613 F-statistic 92.40196 Log likelihood -31.58705

Dari hasil analisis tersebut dapat dikatakan bahwa pendapatan (X1) dan kekayaan (X2) menjelaskan sebesar 96,35 persen dari variasi pola konsumsi (Y), tetapi tidak ada satu pun koefisien regresi yang signifikan. Lebih jauh lagi bukan saja variabel kekayaan tidak nyata, tetapi juga bernilai negatif atau tandanya berlainan dengan yang biasa dihipotesiskan (bertanda positif, kekayaan meningkat maka pola konsumsi juga meningkat). Secara serentak variabel X1 dan X2 bersifat nyata.

Berdasarkan contoh tersebut, jelas dapat kita lihat adanya gejala multikolinearitas. Buktinya adalah nilai F-hitung sangat nyata, tetapi hasil uji-t bagi setiap koefisien regresi tidak ada yang nyata, berarti bahwa kedua variabel X1 dan X2 berhubungan sangat erat, yang tidak mungkin kita dapat mengisolasi pengaruh individual dari pendapatan dan kekayaan. Apabila X1 dan X2 kita regresikan, akan diperoleh hasil sebagai berikut.

LS // Dependent Variable is X2 Date: 10-30-1997 / Time: 10:09 SMPL range: 1 - 10

Number of observations: 10

================================================================ VARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG. ================================================================

C 7.5454545 29.475811 0.2559880 0.804 X1 10.190909 0.1642623 62.040474 0.000 ================================================================ R-squared 0.997926 Mean of dependent var 1740.000 Adjusted R-squared 0.997667 S.D. of dependent var 617.7312 S.E. of regression 29.83972 Sum of squared resid 7123.273 Durbin-Watson stat 2.077534 F-statistic 3849.020 Log likelihood -47.03207

================================================================

Hasil analisis ini jelas menunjukkan, bahwa antara X1 dan X2 terjadi hubungan yang hampir sempurna (R2y = 0,9979).

Sekarang bagaimana hubungan antara Y dengan pendapatan (X1) saja. Hasil regresinya sebagai berikut :

LS // Dependent Variable is Y Date: 10-30-1997 / Time: 10:09 SMPL range: 1 - 10

Number of observations: 10

================================================================ VARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG. ================================================================

C 24.454545 6.4138173 3.8127911 0.005 X1 0.5090909 0.0357428 14.243171 0.000 ================================================================ R-squared 0.962062 Mean of dependent var 111.0000 Adjusted R-squared 0.957319 S.D. of dependent var 31.42893 S.E. of regression 6.493003 Sum of squared resid 337.2727 Durbin-Watson stat 2.680127 F-statistic 202.8679 Log likelihood -31.78092

=================================================================

Dari hasil tersebut jelas terlihat, bahwa pendapatan (X1) sangat nyata pengaruhnya terhadap pola konsumsi, sedangkan sebelumnya tidak nyata pengaruhnya.

Lebih lanjut jika kita regresikan Y terhadap X2, kita peroleh hasil sebagai berikut. LS // Dependent Variable is Y Date: 10-30-1997 / Time: 10:09 SMPL range: 1 - 10 Number of observations: 10 ================================================================ VARIABLE COEFFICIENT STD. ERROR T-STAT. 2-TAIL SIG. ================================================================

C 24.411045 6.8740968 3.5511639 0.007 X2 0.0497638 0.0037440 13.291656 0.000 ================================================================ R-squared 0.956679 Mean of dependent var 111.0000 Adjusted R-squared 0.951264 S.D. of dependent var 31.42893 S.E. of regression 6.938330 Sum of squared resid 385.1233 Durbin-Watson stat 2.417419 F-statistic 176.6681 Log likelihood -32.44428

Dari hasil ini pun, jelas terlihat bahwa kekayaan (X2) sekarang berpengaruh sangat nyata terhadap pola konsumsi, sedangkan sebelumnya tidak nyata pengaruhnya.

Jadi, berdasarkan analisis parsial tersebut memperlihatkan dengan jelas adanya gejala multikolinearitas yang ekstrim, jika menghilangkan salah satu variabel yang sangat erat hubungannya dalam model sering menimbulkan kenyataan, bahwa variabel X yang lainnya signifikan secara statistik.

Autokorelasi

Autokorelasi (autocorrelation) berarti adanya korelasi antar gangguan, sehingga pembahasannya dipusatkan pada penyimpangan asumsi non- autokorelasi (asumsi lainnya dipertahankan). Kasus berautokorelasi ini biasanya terdapat pada data time series, karena ganguan pada individu/ kelompok cenderung mempengaruhi gangguan pada individu/kelompok yang sama pada periode berikutnya. Pada data cross section, masalah autokorelasi relatif jarang terjadi karena gangguan pada observasi yang berbeda berasal dari individu yang berbeda. Pada data time series kasus heteroskedastis jarang terdapat karena selera individu relatif tidak mudah berubah. Penaksiran koefisien pada kasus autokorelasi dengan metode OLS menghasilkan penaksiran yang tak bias (unbiased), tetapi tidak efisien (inefficient). Banyak metode yang digunakan untuk menguji autokorelasi, namun yang paling banyak digunakan adalah uji Durbin-Watson. Uji Durbin-Watson mengasumsikan adanya hubungan antar ganguan i=i-1+i, yaitu mengikuti model otoregresif tingkat satu (first order autoregressive). Statistik d biasanya muncul dalam program komputer regresi. Secara umum bisa diambil patokan: (a) nilai d < -2

berarti ada autokorelasi positif, (b) -2 ≤ d < 2 berarti tidak ada autokorelasi, nilai d > 2 berarti ada autokorelasi positif. Autokorelasi bisa diobati antara lain dengan metode Cochran-Orcutt, model penyesuaian parsial, dan model autoregresif.

Heteroskedastisitas

Heteroskedastisitas (heteroscedasticity), berarti varians gangguan berbeda dari satu observasi ke observasi lainnya, sehingga setiap observasi mempunyai reliabilitas berbeda. Kasus ini adalah penyimpangan kondisi ideal, khususnya asumsi homoskedastisitas. Penaksiran kasus ini dengan OLS merupakan penaksiran yang inefficient maskipun masih unbiased (OLS bukanlah penaksiran tak bias yang memberikan varians terkecil). Adanya selera yang berbeda antara individu/kelompok menyebabkan kasus heteroskedastisitas lebih sering dijumpai dalam data cross section daripada time series. Pengujian heteroskedastisitas paling sederhana adalah dengan membuat scatter plot antara studentized residual dengan nilai standardized predicted yang diproses komputer. Ada beberapa cara mengkuantifikasi pola hubungan antar varians gangguan, seperti uji korelasi rank Sperman, uji Golfeld-Quand, Uji Park, dan uji Glejser. Pengobatan kasus ini antara lain: (1) mentransformasi seluruh variabel dalam bentuk logaritma atau memperbaiki spesifikasi model; (2) metode generalized least squares (GLS).

Dalam dokumen Buku Ajar Ekonometrika FP Anwar (Halaman 32-38)