MAKALAH MULTIKOLINEARITAS PADA ANALISIS REGRESI LINEAR BERGANDA. OLEH : SHANTIKA MARTHA, S.Si NIP

(1)

MAKALAH

MULTIKOLINEARITAS PADA

ANALISIS REGRESI LINEAR BERGANDA

OLEH :

SHANTIKA MARTHA, S.Si NIP. 198403082008122003

UNIVERSITAS TANJUNGPURA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM JURUSAN MATEMATIKA

PONTIANAK 2010

(2)

1.

Judul Makalah

2.

Bidang Ilmu

3.

Penyrsun

a.

Nama

b.

GoV NIP

c.

Fakultas/ Jurusan LEMBARAN PENGESAIIAN

Multikolinearitas Pada Analisis Regresi Linear Berganda

Statistika

Shantika Martha, S.Si III a I 198403082008122003 FMIPA/ Matematika Jurusan Matematika 10171998021001 Penyusurl

fuc

Pontianah Mei 2010

Shantika Martha- S.Si

NrP. 1 98403082008122403

Mengetahui,

(3)

KATA PENGANTAR

Alhamdulillahirabbil’alamin, puji syukur kehadirat Allah SWT karena berkat rahmat dan hidayah-Nya makalah yang berjudul “Multikolinearitas Pada Analisis Regresi Linear Berganda” dapat terselesaikan. Dalam makalah ini dibahas tentang bagaimana cara mendeteksi dan mengatasi masalah multikolinearitas yang seringkali terjadi pada model regresi linear berganda.

Akhirnya penulis mengucapkan terimakasih kepada semua pihak yang telah membantu dalam penyelesaian makalah ini. Penulis juga mengharapkan kritik dan saran dari pembaca demi kesempurnaan makalah. Semoga makalah ini dapat bermanfaat bagi kita semua.

Pontianak, Mei 2010 Penulis

(4)

DAFTAR ISI

KATA PENGANTAR ……….... i

DAFTAR ISI ……….. ii

BAB I PENDAHULUAN ... 1

BAB II ANALISIS REGRESI LINEAR ... 3

2.1 Regresi Linear Sederhana ... 3

2.2 Regresi Linear Berganda ... 4

2.3 Regresi Linear Berganda Baku ... 6

2.4 Metode Kuadrat Terkecil (least squares method) ... 9

BAB III MULTIKOLINEARITAS ... 14

3.1 Dampak dari Multikolinearitas ... 14

3.2 Cara Mendeteksi Adanya Multikolinearitas ... 16

3.3 Cara Mengatasi Multikolinearitas ... 17

BAB IV PENUTUP ... 24

(5)

BAB I PENDAHULUAN

Analisis regresi merupakan suatu alat statistik yang seringkali digunakan sebagai peramalan suatu data untuk masa yang akan datang. Analisis regresi digunakan untuk membangun suatu model matematis yang dapat digunakan untuk meramalkan atau menduga nilai variabel Y (variabel terikat/ dependen/ respon) berdasarkan pada nilai-nilai variabel X (variabel bebas/ independen/ prediktor). Model regresi yang paling sederhana adalah regresi linear sederhana dimana dalam model regresi tersebut hanya terdapat satu variabel bebas saja. Sedangkan jika variabel bebas yang digunakan dalam model regresi lebih dari satu maka disebut regresi linear berganda.

Analisis regresi linear berganda lebih kompleks dari pada analisis regresi linear sederhana karena lebih banyak melibatkan variabel yang dapat menimbulkan permasalahan statistik yang berbeda. Salah satu permasalahan yang sering muncul dalam analisis regresi linear berganda adalah terjadinya multikolinearitas.

Dampak dari multikolinearitas ini dapat mengakibatkan koefisien regresi yang dihasilkan oleh suatu analisis regresi linear berganda menjadi sangat lemah sehingga tidak dapat memberikan hasil analisis yang mewakili sifat atau pengaruh dari variabel bebas yang bersangkutan (Montgomery dan Hines, 1990). Dalam banyak hal masalah multikolinearitas dapat menyebabkan uji T menjadi tidak signifikan. Padahal jika masing-masing variabel bebas diregresikan secara terpisah dengan variabel tak bebas (simple regression), uji T menunjukkan hasil yang signifikan. Hal tersebut sering kali membuat pusing para peneliti karena hasil analisis yang dilakukan pada regresi linear berganda dan regresi linear sederhana tidaklah sejalan atau bahkan sangat bertentangan.

Ada beberapa prosedur yang dapat digunakan untuk mengatasi masalah multikolinearitas. Akan tetapi pada prakteknya, prosedur tersebut sangat tergantung pada kondisi penelitian. Sebagai contoh, prosedur mengenai penggunaan informasi apriori sangat tergantung dari ada atau tidaknya dasar teori

(6)

(literatur) yang sangat kuat untuk mendukung hubungan matematis antara variabel bebas yang saling berkolinear (mempunyai hubungan linear sempurna atau hampir sempurna), prosedur mengeluarkan suatu variabel atau beberapa variabel bebas yang terlibat hubungan kolinear seringkali membuat banyak peneliti keberatan karena prosedur ini akan mengurangi obyek penelitian yang sedang dikerjakan/ dibahas, sedangkan prosedur lainnya seperti menghubungkan data cross sectional

dan data time series, prosedur first difference dan penambahan data baru seringkali hanya memberikan efek yang kecil pada proses penanggulangan masalah multikolinearitas. Oleh karena itu, perlu adanya solusi yang memberikan efek penanggulangan yang besar pada masalah multikolinearitas dalam analisis regresi linear berganda.

Adapun tujuan dari penulisan makalah ini adalah:

1. Menjelaskan dampak dari adanya multikolinearitas dalam data.

2. Menjelaskan bagaimana cara mendeteksi ada tidaknya multikolinearitas antar variabel bebas pada analisis regresi linear berganda.

3. Menjelaskan beberapa cara yang dapat dilakukan untuk mengatasi masalah multikolinearitas.

Dengan adanya makalah ini semoga dapat menjadi bahan referensi dalam mengidentifikasi serta menanggulangi keberadaan multikolinearitas bagi penelitian-penelitian yang akan datang.

(7)

BAB II

ANALISIS REGRESI LINEAR

2.1 Regresi Linear Sederhana

Model regresi linear sederhana dapat ditulis sebagai berikut:

i i i X

Y 0 1  (2.1)

dimana Yi = nilai dari variabel terikat Xi = nilai dari variabel bebas

i

 = nilai dari variabel galat/ error

0

 = konstanta

1

 = koefisien regresi

Dengan menggunakan metode kuadrat terkecil (least squares method) maka nilai ₀ dan ₁ dapat diduga dengan persamaan: Yˆ_i b₀ b₁X_i dimana

1 0,dan

,

ˆ _b _b

Y_i masing-masing merupakan nilai dugaan bagi Yi, 0, dan 1.

Nilai b0 dan b1 diperoleh dengan cara menentukan turunan pertama dari jumlah

kuadrat error (S) terhadap b0 dan b1, kemudian masing-masing turunan tersebut

disamakan dengan nol. Nilai error (ei) merupakan selisih antara nilai pengamatan Yi dengan nilai dugaannyaYˆi, yaitu ei Yi Yˆi sehingga diperoleh:



            2 2 1 1 0 2 0 1 0 2 2 1 0 2 2 n 2 2 ) ( ) ˆ ( X b X b b b XY b Y b Y X b b Y Y Y e S 2 n n n 2 2 n 2 0 2 n 2 2 1 0 1 0 1 0 1 0 0



             X b Y b X b Y b X b Y b X b b Y b S X b Y b0   1 (2.2)

(8)

























 



 



 



                                  Y X XY X X b Y X XY X b X b Y X XY X b X b X b X b Y X XY X b X X b Y XY X b X b XY b S n n n n n n 0 2 n n 2 2 0 2 n n 2 2 0 2 2 2 2 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 1 2 1 0 1





2 2 1 n n



 



   X X Y X XY b (2.3)

2.2 Regresi Linear Berganda

Secara umum, bentuk persamaan regresi linear berganda yang melibatkan k variabel X adalah: i ik k i i i X X X Y ₀ ₁ ₁₂ ₂ ...  (2..4)

Atau dapat ditulis dalam notasi matriks sebagai berikut:

Y = Xb + e (2.5) dimana:              n y y y  2 1

Y adalah matriks berukuran n × 1 yang merupakan nilai-nilai pengamatan

(9)

                1 , 2 1 1 , 2 22 21 1 , 1 21 11 1 1 1 k n n n k k x x x x x x x x x        

X adalah matriks berukuran n × k yang setiap

kolomnya merupakan nilai-nilai pengamatan bagi variabel X, kecuali kolom pertama dari matriks X yang merupakan kolom yang bernilai 1

             1 1 0 k    

b adalah matriks koefisien regresi berukuran k × 1

             n     2 1

e adalah matriks nilai error berukuran n × 1

Seperti halnya pada regresi linear sederhana, pendugaan terhadap nilai b dapat dilakukan dengan metode kuadrat terkecil yaitu dengan cara meminimumkan jumlah kuadrat error. Nilai dugaan bagi koefisien regresi linear berganda pada persamaan (2.5) dapat dihitung dengan menggunakan matriks yaitu dengan rumus: Y X X) (X b T 1 T (2.6)

Beberapa asumsi yang harus dipenuhi oleh persamaan regresi linear berganda agar layak digunakan adalah:

a) Asumsi normalitas, εi ≈ N(0,σ2)

b) Asumsi non-autokorelasi, E(εi, εj) = 0, i ≠ j

c) Asumsi homoskedastisitas, E(εi2) = σ2, untuk semua i

d) Asumsi non-multikolinearitas, yaitu tidak terdapat hubungan linear antar variabel bebas.

(10)

2.3 Regresi Linear Berganda Baku

Model regresi linear berganda baku biasanya digunakan untuk mengendalikan galat pembulatan di dalam perhitungan kuadrat terkecil dan untuk memungkinkan dilakukannya pembandingan koefisien-koefisien regresi dugaan karena sudah mempunyai satuan yang sama (Kutner, Neter dan Wasserman, 1997). Untuk mendapatkan persamaan regresi linear berganda baku, hal pertama yang dilakukan adalah dengan mentransformasikan semua variabel terlebih dahulu. Transformasi yang dilakukan adalah Transformasi Korelasi (Correlation Transformation) yang merupakan suatu modifikasi sederhana dalam pembakuan variabel. Transformasi ini membuat semua unsur di dalam matriks ΧTΧ untuk variabel yang telah ditransformasi bernilai antara -1 dan +1. Proses transformasi dalam pembakuan terhadap variabel terikat Y dan variabel bebas X1, X2, …, Xk-1

dilakukan dengan menggunakan persamaan sebagai berikut:

        _   y i i s y y n y 1 1 ' , untuk i = 1, 2, 3, …, n (2.7)            j j ij ij s x x n x 1 1 ' , untuk j = 1, 2, …, k-1 (2.8) dengan: 1 ) ( 1 2   



 n y y s n i i y (2.9) 1 ) ( 1 2   



 n x x s n i j ij j (2.10) dimana:

y = Rataan variabel terikat Y

j

x = Rataan variabel bebas X

y

s = Standar deviasi variabel terikat Y

j

(11)

'

y = Nilai variabel terikat Y hasil Transformasi Korelasi

1 '



k

x = Nilai variabel bebas X hasil Transformasi Korelasi

Model regresi yang telah mengalami transformasi korelasi disebut Model Regresi Baku (Standardized Regression Model), dengan bentuk umumnya adalah sebagai berikut: ' ' 1 , ' 1 ' 1 ' 2 ' 1 ' 1 ' i k i k i i i x x x y    _ _  (2.11)

Di dalam model regresi baku tidak terdapat parameter intersep (intercept) karena perhitungan metode kuadrat terkecil akan menghasilkan penduga parameter intersep sama dengan nol. Dalam notasi matriks, persamaan normal kuadrat terkecil bagi model regresi baku adalah sebagai berikut:

YX ' XXb r

r  (2.12)

Dan penduga koefisien regresinya adalah sebagai berikut:

YX 1 XX ' r ) (r b   (2.13)

Matriks r_XX merupakan matriks XTX yang variabel-variabel X terlebih dahulu telah mengalami transformasi korelasi, sehingga matriks ini dinamakan matriks korelasi variabel-variabel bebas X. Elemen-elemen pada matriks ini adalah koefisien korelasi sederhana antara semua pasangan variabel-variabel X. Matriks ini bersifat simetris, bahwa r_nk r_kn dengan elemen-elemen pada diagonal utamanya adalah satu. Matriks ini dapat didefinisikan sebagai berikut:

             1 ), 1 ( 13 12 ) 1 ( ) 1 ( 1 k k k r r r  XX r 2 ), 1 ( 32 12 1  k r r r  3 ), 1 ( 23 13 1  k r r r                  1 ) 1 ( , 3 ) 1 ( , 2 ) 1 ( , 1  k k k r r r

(12)

Vektor r_YX adalah sebuah vektor yang elemen-elemennya merupakan koefisien korelasi sederhana antara variabel terikat Y dengan setiap variabel bebas

X. Vektor r_YX merupakan vektor XTY yang variabel-variabelnya terlebih dahulu mengalami transformasi korelasi. Vektor r_YX dapat didefenisikan sebagai berikut:

                    ) 1 ( , 3 2 1 1 ) 1 ( k Y Y Y Y k r r r r  YX r

Elemen-elemen dalam vektor '

b pada persamaan (2.13) adalah koefisien-koefisien penduga dari parameter ₁',₂',,_k_₁' dalam persamaan regresi baku, yang dinamakan koefisien regresi baku (standardized regression coefficients). vektor '

b didefinisikan sebagai berikut:

                  ' 1 ' 2 ' 1 1 ) 1 ( k k b b b  ' b

Hubungan antara elemen-elemen vektor koefisien regresi yang dibakukan ( '

b ) dengan elemen-elemen vektor koefisien regresi (b) dinyatakan dalam bentuk: ' j j y j b s s b _        , untuk j = 1, 2, …, k-1 (2.14)

Untuk memperoleh penduga parameter intersep adalah sebagai berikut:

1 1 2 2 1 1 0ybx b x  bk xk b 

(13)

2.4 Metode Kuadrat Terkecil (least squares method)

Metode Kuadrat Terkecil merupakan metode yang digunakan untuk menduga koefisien regresi dalam persamaan regresi linear dengan mendapatkan penduga yang linear, tidak bias dan mempunyai varians yang minimum atau biasa disebut dengan BLUE (Best Linear Unbiased Estimators). Akan dibuktikan bahwa penduga dalam metode kuadrat terkecil memenuhi sifat BLUE yaitu sebagai berikut:

a) Penduga dalam metode kuadrat terkecil bersifat linear. Y X X) (X b T 1 T (XTX)1XT(Xβε) (X X) X Xβ (X X) X ε 1 1 T T T T     Karena (XTX)1XTXI, maka: ε X X) (X Iβ b  T 1 T

Dalam aljabar matriks berlaku bahwa sebuah matriks akan sama dengan matriks itu sendiri jika matriks tersebut dikalikan dengan matriks identitas, sehingga: ε X X) (X β b  T 1 T (2.15)

Persamaan (2.15) menyatakan bahwa b adalah fungsi linear dari β dan ε. b) Penduga dalam metode kuadrat terkecil bersifat tidak bias (unbias).

Penduga yang tidak bias yaitu E(b)β, yang berarti bahwa koefisien-koefisien nilai penduga dengan metode kuadrat terkecil memusat di seputar nilai-nilai parameter yang sedang diduga (Sarwoko, 2005). Penduga yang tidak bias ini dapat dibuktikan dengan mencari nilai harapan persamaan (2.15) serta mengasumsikan bahwa nilai harapan galat atau E(ε)merupakan matriks nol.

(14)

ε) X X) (X (β (b) E T 1 T E    E(β)E((XTX)1XTε) E(β)(XTX)1XTE(ε) β0 β (b) E _(2.16)

c) Penduga dalam metode kuadrat terkecil adalah penduga yang mempunyai varians minimum.

Diketahui bahwa: Var(b)E



(b)2



E



(bβ)(bβ)T



(2.17) Diasumsikan bahwa E(εεT)_u2I_n, dimana asumsi ini berkaitan dengan asumsi-asumsi varians kovarians faktor-faktor gangguan, yaitu: E(_i2)_u2 dan E(ij)0 untuk i j. Dari persamaan (2.15) diperoleh bahwa:

ε X X) (X β b  T 1 T (2.18)

Dengan mensubstitusikan persamaan (2.18) ke dalam persamaan (2.17) maka diperoleh:



T



E Var(b) (bβ)(bβ) E



((XTX)1XTε)((XTX)1XTε)T



E



(XTX)1XTεεTX(XTX)1



(XTX)1XTE(εεT)X(XTX)1 (XTX)1XT_u2I_nX(XTX)1

Sebuah matriks akan sama dengan matriks itu sendiri jika matriks tersebut dikalikan dengan sebuah matriks identitas. _u2 merupakan sebuah skalar sehingga dapat dipindahkan di belakang atau di depan matriks. Dengan demikian diperoleh:

(15)

1 1 X) X(X X X) (X b  T  T _u T  Var( )  2 _u2(XTX)1XTX(XTX)1 Karena (XTX)1XTXI, maka: 1 X) I(X b  _u T  Var( )  2 _u2(XTX)1 (2.19)

Untuk menunjukkan bahwa varians b adalah varians yang paling minimum, maka akan diasumsikan penduga lain yang linear dan tidak bias, kemudian dibuktikan bahwa variansnya lebih besar daripada varians b.

Misalkan

^

b adalah penduga yang linear dan tidak bias bagi β. Anggaplah bahwa:



(X X) X Z



Y b T 1 T 

^

(2.20) dimana Z adalah matriks konstanta (kn) yang diketahui.



(X X) X Z



(Xβ ε) b T 1 T   ^ (XTX)1XT(Xβε)Z(Xβε) (XTX)1XTXβ(XTX)1XTεZXβZε Iβ(XTX)1XTεZXβZε β(XTX)1XTεZXβZε Sehingga:



β (X X) X ε ZXβ Zε



b E  T 1 T   E( ) ^ β (X X) 1X (ε) ZXβ Z (ε) E E T T      βZXβ (karena E(ε)0) (2.21)

(16)

Oleh karena diasumsikan bahwa b



(XTX)1XT Z



Y

^

adalah penduga bagi β yang mempunyai sifat tidak bias, maka ( )

^

b

E seharusnya sama dengan β. Jadi, ZXβ seharusnya sama dengan matriks nol. Sehingga dapat dikatakan bahwa ZX seharusnya sama dengan nol, jika b



(XTX)1XT Z



Y

^

adalah penduga bagi β yang tidak bias.

Dengan cara yang sama, akan dicari varians dari

^ b yaitu:         ^ 2 ^ ) ( ) (b E b β Var       _ _  T E ( )( ) ^ ^ β b β b E





((XTX)1XT Z)Yβ



((XTX)1XT Z)Yβ



T



E





((XTX)1XT Z)(Xβε)β



((XTX)1XT Z)(Xβε)β



T



E





(XTX)1XTXβ(XTX)1XTεZXβZεβ



(XTX)1XTXβ(XTX)1XTεZXβZεβ



T



Karena (XTX)1XTXI dan ZX adalah matriks nol. Maka diperoleh:









_T _T _T _T T



E Var(b) (X X)1X εZε (X X)1X εZε ^ E





(XTX)1XTεZε



εTZT εTX(XTX)1





E





(XTX)1XT Z

 

εεT ZT X(XTX)1











(XTX)1XT Z



E(εεT)



ZT X(XTX)1











(XTX)1XT Z



_u2I_n



ZT X(XTX)1





 u





(XTX)1XT Z



ZT X(XTX)1





2  _u2



(XTX)1XTZT (XTX)1XTX(XTX)1ZZT ZX(XTX)1



_u2



I(XTX)1ZZT



_u2



(XTX)1ZZT



_u2(XTX)1_u2ZZT (2.22)

(17)

Matriks ZZT adalah tak negatif karena semua diagonal utamanya berbentuk kuadrat. Varians b merupakan varians yang minimum karena varians

^

b lebih besar _u2ZZT daripada varians b, dengan demikian dapat dikatakan bahwa

(18)

BAB III

MULTIKOLINEARITAS

3.1 Dampak dari Multikolinearitas

Istilah Multikolinearitas pertama kali ditemukan oleh Ragnar Frisch yang berarti adanya hubungan linear yang “sempurna” atau pasti diantara beberapa atau semua variabel bebas dari model regresi linear berganda. Multikolinearitas adalah suatu masalah yang timbul karena adanya hubungan linear atau korelasi antar variabel bebas dalam analisis regresi linear berganda (Chattejee dan Bertram, 1991). Gangguan multikolinearitas terjadi jika dalam sebuah model terdapat korelasi antara dua atau lebih variabel bebas. Logikanya, jika kita ingin mencari pengaruh A,B, dan C terhadap D, maka seharusnya tidak ada korelasi baik antara A dan B, A dan C, ataupun B dan C.

Hubungan linear antara variabel-variabel bebas dapat terjadi dalam bentuk hubungan linear yang sempurna (multikolinearitas sempurna). Suatu analisis regresi linear berganda tidak mungkin dapat dilakukan jika terdapat multikolinearitas sempurna antar variabel bebas. Akibat yang dapat terjadi adalah penduga kuadrat terkecil tidak bisa ditentukan serta varians dan kovarians dari parameter menjadi tidak terhingga.

Adanya multikolinearitas dapat mengakibatkan penduga kuadrat terkecil menjadi tidak efisien dan kesimpulan antara uji statistik F dan uji statistik T dalam pengujian hipotesis tentang parameter regresi memiliki kesimpulan yang berbeda. Selain itu, adanya multikolinearitas dalam analisis regresi linear berganda ini juga dapat menyebabkan standar deviasi dari penduga nilainya akan meningkat sehingga nilai penduga parameter yang dihasilkan dari analisis regresi akan tidak tepat. Standar deviasi penduga merupakan akar varians dari penduga (Sarwoko, 2005).

(19)

Adanya multikolinearitas masih dapat menghasilkan penduga yang bersifat tidak bias, tetapi dapat menyebabkan suatu model regresi berganda mempunyai varians dan standar error yang besar. Ini dapat dilihat dari persamaan-persamaan berikut ini: p n e_i  



2 2  (3.1)



    ) 1 ( ) ( 2 1 , 2 1 XX k i k r X b Var  (3.2) dimana: i

e = Nilai kesalahan (error/ galat/ sisaan) n = Jumlah observasi

p = Banyaknya variabel bebas ditambah intersep

2  = Varians sisaan ) (bk1 Var = Varians bk1 XX

r = Korelasi antara variabel-variabel bebas

Jika korelasi antara X₁ dan X₂ (r₁₂) tinggi, maka nilai (1r122) menjadi rendah. Ini akan menyebabkan nilai varians serta standar error b₁ dan b₂ menjadi tinggi.

Gambar berikut ini melukiskan perbandingan distribusi  yang mengandung multikolinearitas dan distribusi tidak mengandung multikolinearitas.

Sumber : Sarwoko, 2005

distribusi  tanpa multikolinearitas

(20)

Perhatikan bahwa kedua distribusi  memiliki nilai rata-rata yang sama sehingga multikolinearitas ini tidak menyebabkan bias. Karena nilai varians yang dihasilkan semakin tinggi mengakibatkan melebarnya distribusi . Apabila nilai varians meningkat maka nilai standar deviasi dari data tersebut akan cenderung meningkat.

Multikolinearitas juga akan mengakibatkan hasil-hasil dugaan menjadi peka terhadap perubahan-perubahan yang kecil. Tambahan atau penghapusan sebuah variabel bebas serta penambahan atau pengurangan jumlah observasi akan menyebabkan perubahan yang besar pada nilai-nilai penduga  (b) jika ada masalah multikolinearitas.

3.2 Cara Mendeteksi Adanya Multikolinearitas

Menurut Gujarati (1978) gejala multikolinearitas ini dapat dideteksi dengan beberapa cara antara lain :

1. Menghitung koefisien korelasi sederhana (simple correlation) antara sesama variabel bebas, jika terdapat koefisien korelasi sederhana yang mencapai atau melebihi 0,8 maka hal tersebut menunjukkan terjadinya masalah multikolinearitas dalam regresi.

2. Menghitung nilai Toleransi atau VIF (Variance Inflation Factor), jika nilai Toleransi kurang dari 0,1 atau nilai VIF melebihi 10 maka hal tersebut menunjukkan bahwa multikolinearitas adalah masalah yang pasti terjadi antar variabel bebas.

3. TOL yakni ukuran toleransi untuk mendeteksi multikolinearitas

𝑇𝑂𝐿_𝑖 = 1

𝐹𝐼𝐹𝑖 = 1 − 𝑅 2

𝑖

1, jika tidak terjadi korelasi antara variabel bebas Xi TOLi

(21)

4. Lakukan regresi antar variabel bebas, kemudian melakukan uji–F dan bandingkan dengan Ftabel. Jika nilai Fhitung melebihi nilai Ftabel berarti dapat

dinyatakan bahwa Xi kolinear dengan X yang lain. 5. Dengan Nilai Eigen dan Indeks Kondisi (IK).

Output SAS dari F. Produksi Cobbdouglas menggunakan nilai eigen dan Indeks Kondisi untuk mengdiagnosis multikolinearitas.

Bilangan Kondisi : 𝐾 =𝜆𝑚𝑎𝑥

𝜆𝑚𝑖𝑛 ,  = nilai eigen

Indeks Kondisi: 𝐼𝐷 = 𝐾

Jika : 100  K  1000 : dari sedang menuju kuat K > 100 : sangat kuat

ID < 10 : lemah

10  ID  30 : sedang menuju kuat ID > 30 : sangat kuat

3.3 Cara Mengatasi Multikolinearitas

Ada beberapa cara untuk mengatasi multikolinearitas yaitu dengan Regresi Stepwise, Regresi Ridge, dan Regresi Komponen Utama (Principal Component Regression). Berikut ini akan dibahas satu persatu mengenai ketiga regresi tersebut.

1. Regresi Stepwise

Regresi stepwise adalah salah satu metode untuk mendapatkan model terbaik dari sebuah analisis regresi. Metode ini merupakan gabungan antara metode forward dan backward. Variabel yang pertama kali masuk adalah variabel yang korelasinya tertinggi dan signifikan dengan variabel dependen, variabel yang masuk kedua adalah variabel yang korelasi parsialnya tertinggi dan signifikan. Setelah variabel tertentu masuk ke dalam model, maka variabel lain yang ada di dalam model dievaluasi. Jika ada variabel yang tidak signifikan maka variabel tersebut dikeluarkan.

(22)

2. Regresi Ridge

Regresi Ridge pertama kali ditemukan oleh A. E. Hoerl pada tahun 1962. Regresi Ridge ini ditujukan untuk mengatasi kondisi buruk yang diakibatkan oleh korelasi yang tinggi antara variabel-variabel bebas X di dalam model regresi berganda, sehingga menyebabkan matriks XTX hampir singular, yang akhirnya menghasilkan nilai penduga parameter dalam persamaan regresi menjadi tidak stabil (Draper dan Smith, 1992).

Regresi Ridge merupakan salah satu cara yang digunakan untuk mengatasi multikolinearitas (kekolinearan ganda) dalam analisis regresi linear berganda. Regresi Ridge ini didapat dengan cara memodifikasi metode kuadrat terkecil sehingga menghasilkan penduga parameter yang lain dalam analisis regresi linear berganda yang mempunyai sifat bias. Apabila suatu penduga mempunyai bias yang kecil, tetapi penduga ini mempunyai ketelitian yang lebih baik dalam menduga parameter dibandingkan penduga yang tidak bias, kemungkinan penduga yang bias ini mempunyai peluang yang lebih besar daripada penduga yang tidak bias untuk menduga parameter yang sebenarnya (Kutner, Neter dan Wasserman, 1997).

Modifikasi metode kuadrat terkecil yang dilakukan dalam Regresi Ridge, yaitu dengan memasukkan konstanta bias ke dalam persamaan normal regresi yang dihasilkan oleh metode kuadrat terkecil. Adapun bentuk persamaan normal Regresi Baku Ridge adalah sebagai berikut:

YX r XX I b r

r  ) 

( c (3.3)

Dengan penduga Regresi Baku Ridge (Ridge Standardized Regression Estimator):

YX XX r r I r b 1 ) (    c (3.4) dimana: XX

r = Matriks korelasi antara variabel-variabel bebas X

YX

r = Matriks korelasi antara variabel bebas terikat X dengan variabel Y

I = Matriks identitas dengan ukuran



(k1)(k1)



c = Konstanta bias, dimana 0c1,cR

(23)

Vektor r

b adalah vektor yang elemen-elemennya merupakan koefisien-koefisien Regresi Baku Ridge. Vektor br didefinisikan sebagai berikut:

                  r k r r k b b b 1 2 1 1 ) 1 (  r b

Hubungan antara elemen-elemen vektor koefisien Regresi Ridge yang dibakukan (br) dengan elemen-elemen vektor koefisien Regresi Ridge (bR) dinyatakan dalam: r j j y R j b s s b _        , untuk j = 1, 2, …, k-1 (3.5)

Penduga parameter intersep dari Regresi Ridge diperoleh dari:

1 1 2 2 1 1 0       k R k R R R x b x b x b y b  (3.6)

Pemilihan konstanta bias c adalah didasarkan pada jejak ridge (ridge trace)

dan nilai Faktor Inflasi Ragam (FIR). Jejak ridge adalah suatu nilai dugaan koefisien-koefisien Regresi Ridge untuk berbagai nilai c yang berbeda. Pemilihan nilai c yang efektif bervariasi dari penerapan satu ke penerapan yang lainnya dan nilai c itu sendiri tidak diketahui sedangkan nilai Faktor Inflasi Ragam (FIR) adalah melihat bagaimana varians penduga meningkat bila ada masalah multikolinearitas dalam model regresi linear berganda.

Untuk mencari nilai pembiasan c, pertama-tama yang harus dilakukan adalah memeriksa jejak ridge dan nilai-nilai FIR, kemudian memilih nilai c yang terkecil yang awalnya menjadikan koefisien-koefisien regresi stabil di dalam jejak ridge dan nilai-nilai FIR menjadi cukup kecil yaitu mendekati 1 atau (FIR)₁ (Kutner, Neter dan Wasserman, 1997).

(24)

3. Regresi Komponen Utama (Principal Component Regression)

Menurut Chattejee dan Price (1991), Regresi Komponen Utama merupakan gabungan antara Analisis Komponen Utama (Principal Component Analysis) dan metode Kuadrat Terkecil (Least Squares Method) yang bertujuan untuk mencari suatu model regresi linear berganda yang tidak mengandung multikolinearitas.

Pada dasarnya prosedur Analisis Komponen Utama bertujuan untuk menyederhanakan variabel yang diamati dengan cara menyusutkan (mereduksi) dimensi suatu data pengamatan tanpa mengurangi sifat/karakteristik data tersebut secara signifikan (Rawlings et al., 1998). Hal ini dilakukan untuk menghilangkan korelasi antar variabel bebas melalui transformasi variabel asli ke variabel baru yang tidak berkorelasi sama sekali. Analisis Komponen Utama dapat memberikan hasil yang maksimal untuk mengatasi multikolinearitas karena dapat membuat variabel bebas yang bersangkutan tidak berkorelasi sama sekali.

Didefinisikan sebuah variabel baru (z) yang merupakan variabel bebas baku. Nilai z merupakan hasil transformasi dari variabel bebas X yang dapat dicari menggunakan rumus sebagai berikut





           j j ij ij s X X n z 1 1 untuk i  1, ,n j  1, ,p (3.7) dimana n X X n i ij j





 1 _{adalah nilai rata-rata bagi} j X dan 1 ) ( 1 2   



 n X X s n i j ij j adalah

varians bagi X_j. Variabel bebas baku yang telah didapat digunakan untuk mencari matriks korelasi (r) variabel bebas Xdengan persamaan berikut

z

z'

r



(3.8)

Untuk mendapatkan variabel baru yang ortogonal (saling bebas), maka terlebih dahulu dicari persamaan karakteristik dari matriks korelasi r untuk mendapatkan nilai karakteristik yang biasa lebih dikenal dengan nilai eigen.

(25)

Bilangan real _j merupakan nilai eigen dari matriks r jika dan hanya jika

j

 memenuhi persamaan karakteristik sebagai berikut:



-



- 0

det r _jI  r _j I  (3.9)

Ketika _jdicari dengan rumus diatas maka didapat bentuk persamaan karakteristik secara umum untuk matriks berukuran pp sebagai berikut

 

1 pλp c_p_₁λp1...c₁λc₀ 0 (3.10) dimana c adalah konstanta. Persamaan polinomial pangkat p tersebut mempunyai akar paling banyak p buah sehingga apabila difaktorkan maka akan didapat nilai

j

 setelah diurutkan menjadi ₁ ₂..._p 0. Dapat dilihat bahwa total semua nilai eigen sama nilainya dengan trace matriks r sebagai berikut

p r p j jj p j j 







 1 1  (3.11)

dimana rjj adalah unsur diagonal matriks r.

Untuk setiap nilai _j terdapat vektor eigen γj=



γ1j γ2j ... γpj



 yang

memenuhi sistem persamaan sebagai berikut:



r λjI



γj 0 (3.12)

Variabel bebas baku (z) yang telah didapat juga digunakan untuk mencari variabel bebas baru yang merupakan komponen utama dengan memasukkan nilainya kedalam bentuk komponen utama dan dikalikan dengan vektor eigen dalam persamaan p pj j j j

γ

z

γ

z

...

γ

z

W



₁ ₁



₂ ₂



untuk j  1, ,p (3.13) Sehingga didapat nilai W yang tidak mengandung multikolinearitas atau ortogonal sesamanya. Variabel W_j yang merupakan padanan nilai _j yang terbesar disebut komponen utama pertama dan seterusnya. Jumlah

(26)

kuadrat setiap variabel baru W_j adalah _j. Dengan kata lain W_j mengambil sejumlah _j dari keragaman total karena dapat dilihat bahwa λ p

p j j 



1 maka jumlah kuadrat totalnya



   n i p j ij p W 1 1 (3.14)

Kemudian dengan menggunakan metode kuadrat terkecil didapat model regresi linear berganda dimana Y sebagai variabel terikat dan variabel W sebagai variabel bebasnya. Apabila model regresi dengan variabel W sebagai variabel bebas telah diperoleh, persamaan ini dapat dikembalikan menjadi fungsi variabel semula X bila dikehendaki, atau ditafsirkan berdasarkan variabel-variabel W

menggunakan Regresi Komponen Utama.

Untuk mengembalikan model regresi linear berganda yang sebelumnya menggunakan variabel Wsebagai variabel bebas ke dalam bentuk model regresi linear berganda dengan menggunakan variabel X sebagai variabel bebasnya dapat dilakukan dengan menggunakan Regresi Linear Berganda Baku.

Apabila persamaan model Regresi Linear Berganda Baku ditetapkan dalam bentuk Regresi Komponen Utama maka didapat persamaan (Chattejee dan Bertram, 1991): i ip p i

W

a

Y

*





₁ ₁





₂ ₂



...







untuk i1,...,n (3.15) dimana: * i

Y = pengamatan ke i dari variabel terikat baku.

i

W = pengamatan ke i dari variabel komponen utama

1

 ,₂,…,_p= koefisien komponen utama yang dapat ditentukan menggunakan rumus: * * 2 2 * 1 1j j pj p j γ



γ



... γ





    untuk j  1, ,p (3.16)

(27)

Model regresi yang tidak mengandung multikolinearitas dapat ditafsirkan dengan memasukkan nilai W satu per satu. Sehingga model regresi dalam fungsi variabel X akan dihasilkan lebih dari satu. Model regresi linear berganda yang ditafsirkan menggunakan seluruh nilai Wtidak dapat digunakan untuk meramal karena model regresi yang ditafsirkan dengan seluruh nilai W sama dengan model regresi yang dihasilkan oleh metode kuadrat terkecil. Apabila model regresi linear berganda telah didapat lebih dari satu maka akan dipilih salah satu yang lebih baik digunakan untuk meramal dengan melihat koefisien determinasi yang dihasilkan oleh setiap model regresi linear berganda. Koefisien determinasiR2 merupakan koefisien yang menjelaskan hubungan antara variabel terikat Ydan variabel bebas

X. Nilai R2 tinggi menunjukkan bahwa kemampuan variabel bebas dalam menjelaskan variasi variabel terikat sangat besar, apabila nilai R2 rendah menunjukkan bahwa kemampuan variabel bebas dalam menjelaskan variasi variabel terikat sangat terbatas (Widarjono, 2005). Nilai R2 dapat dicari menggunakan rumus berikut ini:

) ( 1 2 2



   Y Y R i i  (3.17)

Adapun keuntungan dari penggunaan Analisis Komponen Utama (Principal Component Analysis) dibandingkan dengan metode lain adalah :

1. Dapat menghilangkan korelasi secara bersih (korelasi = 0) sehingga masalah multikolinearitas dapat benar-benar teratasi secara bersih.

2. Dapat digunakan untuk segala kondisi data / penelitian. 3. Dapat dipergunakan tanpa mengurangi jumlah variabel asal.

4. Walaupun metode regresi ini memiliki tingkat kesulitan yang tinggi, akan tetapi kesimpulan yang diberikan lebih akurat dibandingkan dengan penggunaan metode lain.

(28)

BAB IV PENUTUP

Multikolinearitas adalah suatu masalah yang timbul karena adanya hubungan linear atau korelasi antar variabel bebas dalam analisis regresi linear berganda. Adanya multikolinearitas berdampak pada koefisien regresi yang dihasilkan oleh suatu model regresi linear berganda dan secara tidak langsung akan berdampak pula pada hasil analisisnya.

Pendugaan parameter regresi yang dihasilkan oleh metode kuadrat terkecil akan dapat memenuhi sifat penduga terbaik ketika data tidak mengandung multikolinearitas. Ada beberapa metode yang dapat dilakukan jika data yang digunakan mengandung multikolinearitas yaitu, dengan Regresi Stepwise, Regresi Ridge, dan Regresi Komponen Utama (Principal Component Regression). Masing-masing metode tersebut memiliki keunggulan dan kelemahannya serta sangat tergantung pada kondisi dan tujuan penelitian.

Disarankan untuk membuat simulasi data yang mengandung multikolinearitas agar memperoleh gambaran yang lebih jelas mengenai keunggulan dan kelemahan dari ketiga metode tersebut.

(29)

DAFTAR PUSTAKA

Chattejje, S. and Price, B. 1991. Regression Analysis By Example Second Edition. A Siley-Interscience Publication John Wiley and Sonc.Inc. Newyork. Draper, N. dan Smith, H. 1992. Analisis Regresi Terapan Ed ke-2. Alih bahasa:

Bambang Sumantri. PT. Gramedia Pustaka Utama. Jakarta. Gujarati, D. Ekonometrika Dasar. Erlangga. Jakarta.

Kusnandar, D. 2004. Metode Statistik dan Aplikasinya dengan Minitab dan Excel. Madyan Press. Yogyakarta.

Kutner, M. H.; Neter, J. dan Wasserman, W. 1997. Model Linear Terapan. Alih bahasa: Bambang Sumantri. Jurusan Statistik FMIPA IPB. Bogor.

Montgomery, D. C. dan Hines, W. W. 1990. Probabilita dan Statistik dalam Ilmu Rekayasa dan Manajemen Ed ke-2. Alih bahasa: Rudiansyah. UI Press. Jakarta.

Rawlings, J. O.; Pantula, S. G. and Dickey, D. A. 1998. Applied regression analysis. Ed ke-2. Springer. New York.

Sarwoko. 2005. Dasar-dasar Ekonometrika. Andi Offset. Yogyakarta.

Widarjono, A. 2005. Ekonometrika Teori dan Aplikasi untuk Ekonomi dan Bisnis. Ekonisia Fakultas Ekonomi UII. Yogyakarta.