BAB II LANDASAN TEORI. penulisan skripsi yaitu mengenai data panel, beberapa bentuk dan sifat

(1)

Pada Bab II ini akan dibahas dasar-dasar teori yang digunakan dalam penulisan skripsi yaitu mengenai data panel, beberapa bentuk dan sifat matriks, matriks partisi, bentuk linier dan bentuk kuadratik beserta ekspektasinya, regresi linear beserta metode penaksirannya, dan juga metode ANOVA.

2.1 Data Panel

2.1.1 Definisi dan Deskripsi Data Panel

Telah diketahui bahwa data cross section merupakan data yang dikumpulkan pada satu waktu terhadap banyak individu. Sedangkan data time series adalah data yang dikumpulkan dari waktu ke waktu terhadap suatu individu. Berdasarkan Nachrowi (2006), data cross section yang dikumpulkan atau diobservasi pada periode waktu tertentu dikenal dengan nama data panel.

Dalam analisis perekonomian, data panel ini sangat banyak ditemui. Misalkan data pertumbuhan perekonomian provinsi-provinsi di Indonesia dari tahun 2000 sampai 2007. Data ini merupakan kumpulan informasi terhadap semua provinsi di Indonesia yang berjumlah 33 provinsi dan dikumpulkan selama jangka waktu 8 tahun.

(2)

Data panel terdiri dari dua bentuk, yaitu data panel lengkap (complete panel data) dan data panel tidak lengkap (incomplete panel data). Baik data panel tidak lengkap maupun data panel lengkap mempunyai model regresi yang sama, yakni y_it = +α x β_itk _k +u_it. Berdasarkan komponen error u , model regresi untuk data panel _it lengkap dan data panel tidak lengkap dibedakan menjadi dua, yaitu model regresi komponen error satu arah (one-way error component regression models), dengan u_it =μ_i +v_it dan model regresi komponen error dua arah (two-way error component regression models), dengan

u_it =μ λ_i+ +_t v_it.

Diberikan bahwa μi adalah pengaruh khusus yang tidak teramati (error) dari individu ke-i tanpa dipengaruhi waktu, misalkan kemampuan atau keunggulan khusus dari suatu individu yang tidak dimiliki oleh individu lainnya. λ_t adalah pengaruh yang tidak teramati pada waktu ke-t tanpa dipengaruhi individu, misalkan pada suatu waktu tertentu ada peristiwa yang tidak terobservasi yang

mengakibatkan hasil observasi menjadi tidak lazim dari waktu sebelumnya. Selanjutnya v_it adalah pengaruh (error) yang benar-benar tidak diketahui (remainder disturbance).

Pada data panel lengkap baik untuk model regresi komponen error satu arah maupun model regresi komponen error dua arah

(3)

sama-sama memiliki banyak elemen individu i= 1, …, N dan banyak elemen periode atau waktu t= 1, …, T. Dengan kata lain kedua model regresi tersebut memiliki dimensi NT.

Namun pada data panel tidak lengkap, untuk model regresi komponen error satu arah banyaknya elemen individu i= 1, …, N dan banyaknya elemen waktu t= 1, …, Ti (sebanyak N individu yang

diobservasi, data untuk masing-masing individu tersebut diambil pada periode ke-i, yaitu masing-masing individu memiliki data dengan periode waktu yang berbeda). Sedangkan untuk model regresi

komponen error dua arah banyaknya elemen individu i=1,…,Nt (jumlah

individu yang diobservasi pada tahun ke-t berbeda-beda) dengan elemen waktu t=1,…,T.

2.1.2 Kelebihan Data Panel

Beberapa kelebihan dari data panel, antara lain:

1. Data panel dapat memberikan informasi yang lebih jelas tentang keberagaman suatu data. Hal ini disebabkan karena data panel,

sesuai dengan definisi sebelumnya, dikumpulkan atau diobservasi dari beberapa individu yang beragam pada periode waktu tertentu.

Sedangkan pada data cross section, data diobservasi dari beberapa individu yang beragam, namun pada satu waktu tertentu. Dengan demikian, data panel akan lebih beragam daripada data cross section.

(4)

Begitu pula dengan data time series, data dikumpulkan dari satu individu pada periode waktu tertentu. Tentunya, data time series kurang beragam daripada data panel.

2. Menyediakan data yang lebih banyak sehingga data yang ada menjadi lebih informatif, lebih bervariasi, dan efisien. Alasannya, hal ini sesuai dengan definisi data panel, yang merupakan kombinasi dari data cross section dan data time series.

2.1.3 Kekurangan Data Panel

Namun kekurangan dari data panel:

1. Data panel sering bermasalah dalam hal pengumpulan data. Ini disebabkan karena pengumpulan data panel tidak hanya

membutuhkan dana dan tenaga kerja yang besar, tetapi juga waktu yang lama.

2. Setelah dilakukan pengumpulan data, tentu data panel akan dianalisis lebih lanjut. Hal ini berakibat model yang menggunakan data ini

menjadi lebih kompleks karena tidak hanya menganalisa individu saja tetapi juga waktu. Dengan demikian diperlukan teknik tersendiri dalam menganalisis model yang menggunakan data panel.

(5)

2.2 Notasi dan Terminologi Matriks

Matriks adalah suatu susunan bilangan berbentuk segiempat. Bilangan-bilangan dalam susunan itu disebut entri dalam matriks.

Ukuran matriks ditentukan oleh banyaknya baris dan banyaknya kolom yang dimiliki oleh matriks tersebut. Matriks yang hanya terdiri dari satu kolom yaitu berukuran m×1 disebut matriks kolom (atau vektor kolom), dan matriks yang terdiri dari satu baris yaitu berukuran

×

1 n disebut matriks baris (atau vektor baris).

Dalam tugas akhir ini matriks dinotasikan dengan huruf kapital yang dicetak tebal dan vektor dinotasikan dengan huruf kecil dicetak tebal. Matriks A berukuran m n× adalah matriks yang terdiri dari m baris dan n kolom dengan entri pada baris ke-i dan kolom ke-j dapat dinyatakan dengan simbol

( )

A _ij =a_ij, sehingga

A n n m m mn a a a a a a a a a ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ = ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ 11 12 1 21 22 2 1 2 L L M M M L . (2.2.1)

Persamaan (2.2.1) dapat dituliskan dengan A= ⎣ ⎦ atau ⎡ ⎤a_{ij m n}_× ⎡ ⎤_{⎣ ⎦ .}a_ij Sebagai contoh, matriks A

1 2 3 4 ⎡ ⎤ = ⎢ ⎥ ⎣ ⎦ A memiliki entri

( )

11=1, 2, 3 12 = 21= dan 4.22 = A A A A

(6)

Matriks A yang memiliki n baris dan n kolom disebut matriks bujur sangkar berorde n, dan entri a a₁₁, ₂₂,_K,a_nndisebut sebagai diagonal utama dari A (lihat entri yang dilingkari), dengan

11 12 1 21 22 2 1 2 A ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ = ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ n n n n nn a a a a a a a a a L L M M M L .

Berikut ini akan dibahas beberapa operasi atau sifat matriks dan beberapa matriks bentuk khusus yang dipakai pada tugas akhir ini.

2.3 Trace Matriks

Misalkan A= ⎣ ⎦⎡ ⎤aij suatu matriks persegi berukuran n n× , maka trace dari A didefinisikan sebagai jumlah dari elemen diagonal A dan dinotasikan dengan tr A

( )

, yaitu tr

( )

A =a11+a22+ +K ann. Beberapa sifat dari trace lainnya adalah sebagai berikut:

1. tr

( )

In =n 2. tr k⎡_⎣

( )

⎤ =_⎦ k 3. tr k

( )

A = ⋅k tr

( )

A 4. tr

(

A B+

)

=tr

( )

A +tr

( )

B

(7)

dimana k adalah sembarang skalar, sedangkan A dan B adalah matriks berukuran n n× . Untuk k k1, 2, K, kr adalah sembarang skalar dan A A1, 2, K, Ar adalah matriks berukuran n n× maka

( )

1 1 tr tr . = = ⎛ ⎞₌ ⎜ ⎟ ⎝

∑

A ⎠

∑

A r r i i i i i i k k

Jika A adalah matriks persegi dengan A A₁₁, ₂₂, _K, A_kk adalah matriks partisi dari 11 12 1 21 22 2 1 2 ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ =_⎜ _⎟ ⎜ ⎟ ⎝ ⎠ A A A A A A A A A A L L M M O M L k k k k kk maka tr

( )

A =tr

( ) (

A11 +tr A22

)

+K+tr

( )

Akk .

Misalkan A= ⎣ ⎦⎡ ⎤a_ij adalah matriks berukuran m n× dan b

⎡ ⎤ = ⎣ ⎦

B ij adalah matriks berukuran n m× , maka

( )

1 1 tr a b = = =

∑∑

AB m n ij ji i j dimana 1 a b = ⎡ ⎤ = ⎢ ⎥ ⎣

∑

⎦ AB n _ij _ji j

. Berdasarkan persamaan (2.3.1) dan sifat

transpos matriks maka

tr

( )

AB =tr

(

B A′ ′

)

(2.3.2) yang dapat diperluas sebagaimana diberikan pada lemma berikut ini.

Lemma 2.3.1 Untuk sembarang matriks A berukuran m n× dan matriks B berukuran n m× maka tr

( )

AB =tr

( )

BA .

(8)

( )

1 1 1 1 1 1 tr a b a b b a tr = = = = = = =

∑∑

=

∑∑

=

∑∑

= AB m n _ij _ji n m _ij _ji n m _ji _ij BA i j j i j i

Catatan: Berdasarkan persamaan (2.3.2) dan lemma 2.3.1, untuk sembarang matriks A berukuran m n× dan matriks B berukuran n m× , maka tr

( )

AB =tr

(

B A′ ′

)

=tr

(

A B′ ′

)

=tr

( )

BA .

Bentuk di atas dapat diperluas untuk trace dari perkalian matriks ABC di mana A matriks berukuran m n× , B matriks berukuran n p× , dan

C matriks berukuran p m× sehingga

tr

(

ABC

)

=tr

(

CAB

)

=tr

(

BCA

)

. (2.3.3)

2.4 Matriks Partisi

Setiap matriks bisa dibagi atau dipartisi menjadi matriks-matriks yang lebih kecil. Matriks yang lebih kecil itu disebut submatriks.

Berikut ini akan diberikan contoh tiga partisi yang mungkin dari sebuah matriks A yang berukuran 3 4× , yaitu:

11 12 13 14 11 12 21 22 23 24 21 22 31 32 33 34 A A A A A a a a a a a a a a a a a ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ =_⎢ _{⎥ ⎢}= _⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ (2.4.1) ⎡ _{⎤ ⎡ ⎤} ⎢ _{⎥ ⎢ ⎥} =_⎢ _{⎥ ⎢ ⎥}= ⎢ _{⎥ ⎢ ⎥}_{⎣ ⎦} ⎣ ⎦ 11 12 13 14 1 21 22 23 24 2 31 32 33 34 3 r A r r a a a a a a a a a a a a (2.4.2)

(9)

[

]

⎡ ⎤ ⎢ ⎥ =_⎢ _⎥= ⎢ ⎥ ⎣ ⎦ 11 12 13 14 21 22 23 24 1 2 3 4 31 32 33 34 A c c c c a a a a a a a a a a a a (2.4.3)

Jika terdapat dua matriks yang dapat dipartisi yang bersesuaian A dan B, sehingga masing-masing submatriks yang dimiliki juga

bersesuaian. Maka perkalian AB diperoleh menggunakan pola perkalian matriks biasa, yakni contohnya

11 12 11 12 21 22 21 22 A A B B AB A A B B ⎛ ⎞⎛ ⎞ = ⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠ 11 11 12 21 11 12 12 22 21 11 22 21 21 12 22 22 A B A B A B A B A B A B A B A B + + ⎛ ⎞ = ⎜ ₊ ₊ ⎟ ⎝ ⎠ (2.4.4) 2.5 Matriks Diagonal

Suatu matriks A= ⎣ ⎦⎡ ⎤aij yang berukuran n n× yang memiliki elemen diagonal utama a a₁₁, ₂₂,_K,a_nn dikatakan matriks diagonal, jika elemen selain diagonal utama dari matriks tersebut adalah nol.

Contoh, misalkan terdapat matriks

( )

3 2 6 3 0 0 2 10 7 , maka 0 10 0 6 7 9 0 0 9 diag ⎛ ⎞ ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ =_⎜ − _⎟ =_⎜ _⎟ ⎜ ₋ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ A A .

(10)

Selain itu misalkan B merupakan matriks partisi

( )

, maka diag ⎛ ⎞ ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ =_⎜ _⎟ =_⎜ _⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ 11 12 13 11 21 22 23 22 31 32 33 33 B B B B 0 0 B B B B B 0 B 0 B B B 0 0 B .

2.6 Matriks Bentuk Khusus dan Operasinya

2.6.1 Summing Vectors, Matriks – J, dan Matriks – E

Vektor yang tiap elemennya hanya berisikan bilangan 1 disebut summing vectors dan dinotasikan dengan ι , misalkan ι₃ =

[

1 1 1

]

′. Ini disebut summing vectors dikarenakan jika x= ⎡_⎣x₁ x₂ x₃⎤_⎦′,

3 3′ =x

∑

_i₌₁xi

ι .

Matriks – J merupakan matriks bujur sangkar yang dihasilkan dari perkalian summing vectors

1 1 1 1 1 1 1 1 1 n n Jn L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ′ = = ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ι ι

dengan vektor ι_n berukuran 1n× dan matriks J berukuran _n n n× . Beberapa sifat dari matriks – J antara lain

1). J2_n =nJ_n 2). J_{n n}ι =nι_n 3). tr

( )

J_n =n

(11)

4). 1 n n n J = J 5). J J_{n n} = J_n 6). tr

( )

J_n = 1 7). J2_n =J_n.

Kemudian didefinisikan matriks E_n = −I_n J_n berukuran n x n, dengan In matriks identitas ukuran n x n. Beberapa sifat dari matriks – E yakni

1). tr

( )

E_n = −n 1 2). Eι =0

3). E2 = E

2.6.2 Matriks – Q, Matriks – P, dan Matriks – Z

Didefinisikan matriks – Q merupakan matriks bujur sangkar yang berbentuk matriks diagonal

( )

1 2 i n diag E 0 0 0 E 0 Q E 0 0 E L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ = =_⎜ _⎟ ⎜ ⎟ ⎝ ⎠ . (2.6.1)

Pada model regresi untuk data panel, matriks – Q berperan sebagai matriks deviasi dari mean individu. Misal diberikan suatu vektor u berukuran 1n× maka Qu=

(

u_i −u.

)

, dengan i = 1, ..., n.

(12)

Kemudian matriks – P didefinisikan sebagai matriks diagonal

( )

1 2 i n diag J 0 0 0 J 0 P J 0 0 J L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ = _{= ⎜} _⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ . (2.6.2)

Dalam model regresi untuk data panel, matriks – P berperan sebagai matriks rata-rata dari observasi sepanjang waktu untuk masing-masing individu. Misalkan diberikan diberikan suatu vektor u, berukuran n× , 1

maka 1 . n i i u u n = = =

∑

Pu , dengan i = 1, ..., n.

Selanjutnya untuk matriks – Z didefinisikan

( )

1 2 i n diag 0 0 0 0 Z 0 0 L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ = = ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ι ι ι ι . (2.6.3)

Pada model regresi untuk data panel, matriks – Z berperan sebagai matriks yang menyederhanakan penulisan pengaruh yang tidak teramati dari individu, μ_i, dengan periode waktu yang berbeda-beda, t=1,…,Ti.

2.7 Bentuk-bentuk Matriks Lainnya

Definisi 2.7.1 Didefinisikan A adalah matriks yang berukuran n n× , maka A dikatakan matriks simetris jika A A′= .

(13)

Definisi 2.7.2 Misalkan A adalah matriks yang berukuran n n× , maka A dikatakan matriks idempotent jika A AA= .

Jika A juga merupakan matriks simetris, maka A dikatakan symmetric idempotent. Jika A symmetric idempotent, maka I A− juga symmetric idempotent.

Definisi 2.7.3 Misalkan A adalah matriks yang berukuran n n× , maka A dikatakan matriks ortogonal, jika A A I′ = . Maka dapat dinyatakan bahwa A−1=A′.

Lemma 2.7.4 Diketahui suatu matriks X, yang berukuran n K× , dan X adalah matriks full rank, maka

(

_′

)

-1 _′

X X X X merupakan matriks idempotent. Bukti:

(

)

(

_′ -1 _′

)

(

_′

)

-1 _′

)

(

_′

) (

-1 _′

)(

_′

)

-1 _′ = X X X X X X X X X X X X X X X X

(

_′

)

-1 _′ =X X X I X _n

(

_′

)

-1 _′ = X X X X

(14)

2.8 Bentuk Linier dan Bentuk Kuadratik 2.8.1 Notasi Bentuk Linier

Misalkan a=

[

a₁, ,_K a ′_n

]

adalah vektor kolom berdimensi n, dan pandang fungsi a x′ =

∑

_ia x_i _i , dengan vektor x=

[

x₁, ,_K x ′_n

]

di n. Fungsi tersebut merupakan fungsi bentuk linier.

2.8.2 Notasi Bentuk Kuadratik, Definit Positif dan Semidefinit Positif

Misalkan matriks A= ⎣ ⎦ berukuran ⎡ ⎤a_ij n n× dan pandang fungsi

2 , , x Ax _ij _i _j _i _i _ij _i _j i j i i j i a x x a x a x x ≠ ′ =

∑

=

∑

+

∑

(2.8.1)

dengan vektor x=

[

x₁, ,_K x ′_n

]

di n. Fungsi pada persamaan (2.8.1) merupakan bentuk kuadratik.

Definisi 2.8.2.1 Misalkan x Ax′ merupakan bentuk kuadratik dengan A_{= ⎣ ⎦ adalah matriks berukuran}⎡ ⎤a_ij n n× dan vektor x=

[

x₁, ,_K x ′_n

]

di

n

. Bentuk kuadratik dikatakan definit positif jika 0 untuk setiap 0

x A x′ > , x≠ (2.8.2a) Bentuk kuadratik dikatakan semidefinit positif jika

0 untuk setiap 0

x A x′ ≥ , x≠ (2.8.2b) Matriks definit positif dapat difaktorisasi ke dalam bentuk matriks akar kuadrat yang dikenal dengan Cholesky decomposition. Misalkan A

(15)

matriks definit positif ukuran n n× , maka matriks tersebut dapat difaktorkan menjadi

′ = A T T .

Dimana T adalah matriks segitiga atas nonsingular.

Definisi 2.8.2.2 Matriks simetris A disebut matriks definit positif jika x Ax′ adalah bentuk kuadratik definit positif.

Definisi 2.8.2.3 Matriks simetris A disebut matriks semidefinit positif jika x Ax′ adalah bentuk kuadratik semidefinit positif.

Berikut ini adalah lemma mengenai matriks definit positif yang merupakan matriks nonsingular.

Lemma 2.8.2.4 Sembarang matriks definit positif adalah nonsingular. Bukti:

Misalkan matriks A berukuran n n× merupakan matriks definit positif. Lemma 2.8.2.4 akan dibuktikan dengan menggunakan kontradiksi. Andaikan A merupakan matriks singular atau secara ekuivalen

( )

A .

rank <n Akibatnya, kolom A tidak bebas linier dan terdapat vektor tidak nol x , sedemikian sehingga _* A x_* = . Oleh karena itu 0

(

)

0

* * * * *

x A x′ =x A x′ =x 0′ = . Padahal A merupakan matriks definit positif, artinya

0 untuk setiap 0 x A x′ > , x≠ .

(16)

Sedangkan jika A merupakan matriks singular diperoleh bahwa

(

)

0

* * * * *

x A x′ =x A x′ =x 0′ =

Berarti kontradiksi dengan pengandaian yang digunakan. Sehingga sembarang matriks definit positif adalah nonsingular.

2.8.3 Ekspektasi dari Bentuk Kuadratik

Teorema 2.8.3.1 Jika y adalah suatu vektor acak dengan mean μ dan matriks kovarians Σ , dan jika terdapat matriks simetris A, maka

(

)

( )

E y Ay′ =tr AΣ +μ μ′A (2.8.3) Bukti:

Diketahui bahwa cov

(

y y_i, _j

) ( )

=E y y_i _j −μ μ_i _j, yang jika dibentuk dalam format matriks menjadi Σ=E

( )

yy′ −μμ′. Kemudian dapat diubah ke dalam bentuk

( )

E yy′ = +Σ μμ′. (2.8.4)

Diketahui bahwa y Ay′ adalah suatu skalar, yang nilainya sama dengan nilai trace-nya. Selanjutnya didapatkan

(

)

(

)

E y Ay′ _{= ⎣}E tr⎡ y Ay′ ⎤_⎦

(

)

E tr⎡ Ayy′ ⎤ = ⎣ ⎦

(

)

tr E⎡ Ayy′ ⎤ = ⎣ ⎦

( )

tr⎡AE yy′ ⎤ = ⎣ ⎦

(17)

(

)

tr⎡A Σ ′ ⎤ = _⎣ +μμ _⎦

[

]

tr AΣ A ′ = + μμ

( )

(

)

tr AΣ tr A ′ = + μμ

( )

(

)

tr AΣ tr ′A = + μ μ (dari lemma 2.3.1)

( )

tr AΣ ′A = +μ μ (2.8.5)

Perlu diperhatikan bahwa y Ay′ bukan fungsi linear dari y, sehingga

(

)

( )

E y Ay′ ≠E y A′ E y .

2.9 Regresi Linier Berganda

Analisis regresi adalah suatu metode yang digunakan dalam menganalisis satu atau lebih variabel prediktor X dengan satu variabel respon Y. Pola hubungan itu dapat dinyatakan dalam bentuk

persamaan regresi.

Model regresi linier yang melibatkan lebih dari satu variabel prediktor dengan satu variabel respon disebut model regresi linier berganda.

2.9.1 Model Regresi Linier Berganda

Pola hubungan antar variabel yang terdiri dari satu variabel tak bebas atau variabel respon y dan beberapa variabel bebas atau

(18)

variabel prediktor

(

x x₁, , ,₂ _K x_k

)

dapat ditunjukkan oleh salah satu model regresi linier.

Berikut ini akan diberikan ilustrasi data untuk regresi linier berganda, yaitu: Pengamatan i y x1 x2 K xk 1 y1 x11 x12 K x1k 2 y2 x21 x22 K x2k M M M M M n yn xn1 xn2 K xnk

Model regresi linier dapat dituliskan dalam bentuk sebagai berikut 0 1 1 2 2 0 1 , i i i k ik i k j ij i j y x x x x = = + + + + + = +

∑

+ K β β β β ε β β ε (2.9.1)

=1 2_K ialah banyaknya pengamatan. i , , ,n

Apabila dinyatakan dalam notasi matriks, maka persamaan (2.9.1) menjadi y X= β ε (2.9.2) + k k n n n nk k n y x x x y x x x y x x x y , X , , ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ = = = = ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ 1 11 12 1 0 1 2 21 22 2 1 2 1 2 1 1 1 L L M M M M M M M L β ε β ε β ε β ε dengan

(19)

X : matriks dari variabel prediktor yang berukuran n p× , dengan p k= + 1.

β : vektor kolom dari parameter yang berukuran p× . 1 ε : vektor kolom dari error yang berukuran n× 1. Model regresi linier berganda di atas mempunyai asumsi sebagai berikut:

( )

(

)

i i j i E i n E i j i j N . , , , . . , = = = ≠ = 2 = 2 1 0 untuk 1 2 2 0 untuk untuk 3 0 K ε ε ε σ ε σ

Dalam notasi matriks dinyatakan dengan:

( )

1.

2. dengan merupakan matriks identitas

3. mempunyai distribusi normal dengan mean dan variansi

2 2 0 I, I 0 I. E E σ σ ε εε ε = ′ =

2.9.2 Taksiran Parameter Dalam Regresi Linier Berganda

Ada banyak metode yang dapat digunakan dalam menaksir parameter pada model regresi linier berganda. Berikut ini pembahasan mengenai beberapa metode taksiran.

Pada subbab ini dijelaskan metode taksiran Ordinary Least Squares (OLS), dan Generalized Least Squares (GLS) yang

(20)

digunakan untuk menaksir parameter pada model y X= β ε , dengan + X memiliki rank penuh, E y

( )

= βX danE

( )

ε =0.

2.9.2.1 Ordinary Least Squares (OLS)

Untuk menaksir parameter model regresi dengan menggunakan metode ordinary least squares maka asumsi-asumsi (1), (2), (3) yang telah disebutkan pada subbab 2.9.1 harus dipenuhi.

Fungsi least squares atau sum of squares of error (SSE) dinyatakan dengan:

(

)

2 0 1 1 2 0 1 1 , , , _k n _i i n k i j ij i j S S y x = = = = = ⎛ ⎞ = _⎜ − − _⎟ ⎝ ⎠

∑

K β β β ε β β (2.9.3)

Fungsi S akan diminimumkan terhadap β β₀, ,₁_K,β_k_. Taksiran least squares dariβ β₀, ,₁_K,β_k harus memenuhi

0 1 0 1 1 0 2 0 (2.9.4a) k n k i j ij i j S y x = = ⎛ ⎞ ∂ = − _⎜ − − _⎟= ∂β _{β β}_{ˆ ˆ}_{, , ,}_K_β_ˆ

∑

_⎝ βˆ

∑

βˆ _⎠

(

)

0 1 0 1 1 dan 2 0 2.9.4b untuk setiap 1 2 k n k i j ij ij i j j S y x x j k = = ⎛ ⎞ ∂ _{= −} ₋ ₋ ₌ ⎜ ⎟ ∂ _⎝ _⎠ =

∑

ˆ ˆ_{, , ,}ˆ ˆ ˆ , , , . K K β β β β β β

(21)

Dengan menguraikan persamaan (2.9.4a) dan (2.9.4b), diperoleh sistem persamaan normal:

n n n n i i k ik i i i i i n n n n n i i i i k i ik i i i i i i i n n n n n ik ik i ik i k ik ik i i i i i i n x x x y x x x x x x x y x x x x x x x y ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ 1 = = = = 1 = = = = = 1 = = = = = + + + + = + + + + = + + + + =

∑

0 1 2 2 1 1 1 1 2 0 1 1 2 1 2 1 1 1 1 1 1 1 2 0 1 2 2 1 1 1 1 1 L L M M M M M L β β β β β β β β β β β β (2.9.5) Pada persamaan (2.9.5) terdapat p k= + persamaan normal, 1

masing-masing memiliki koefisien regresi yang tidak diketahui. Dalam notasi matriks persamaan (2.9.3) adalah:

( )

(

) (

)

2 1 2 y X y X y y X y y X X X y y X y X X n i i S ε = = ′ = ′ = − − ′ ′ ′ ′ ′ ′ = − − + ′ ′ ′ ′ ′ = − +

∑

β ε ε β β β β β β β β β. (2.9.6)

Karena β′ ′X ymerupakan matriks berukuran 1 1 atau skalar dan × transposnya

(

β′ ′X y

)

′ =y X′ β juga skalar yang sama, maka:

2 2 sehingga, S ∂ _{= −} _′ ₊ _′ ₌ _′ ₌ _′ ∂ ˆ ˆ ˆ X y X X 0 X X X y β β β β (2.9.7)

disebut sebagai persamaan normal least squares, yang merupakan bentuk matriks dari persamaan (2.9.5).

(22)

Dengan mengalikan kedua ruas pada persamaan (2.9.7) dengan invers dari matriks X X′ yang nonsingular, didapat

penyelesaian sistem persamaan normal yang memberikan taksiran least squares β , yaitu:

(

)

1

ˆ _{X X}_′ − _{X y}_′

=

β (2.9.8)

dengan syarat invers matriks

(

X X′

)

−1 ada, jika variabel independent yang ada bersifat linearly independent.

Ekspektasi dan kovariansi dari taksiran parameter dengan metode ordinary least squares adalah sebagai berikut:

1. E

( )

βˆ = ⎣E⎡

(

X X′

)

−1X y′ _⎦⎤

(

)

1

(

)

E⎡ ′ − ′ ⎤ = _⎣ X X X X β ε+ _⎦

(

)

1

(

)

1 E⎡ ′ − ′ ′ − ′ ⎤ = _⎣ X X X Xβ+ X X X ε_⎦

(

)

1

( ) (

)

1

( )

E E − − ′ ′ ′ ′ = X X X X β + X X X ε = β

Karena E

( )

ε =0 dan

(

X X′

)

−1X X I.′ = Sehingga ˆβ merupakan taksiran unbiased untuk β .

(23)

( )

₍

( )

)

₍

( )

)

(

)(

)

Cov ˆ ˆ ˆ ˆ ˆ ˆ ˆ E E E E ⎡ ′⎤ = _⎢ − − _⎥ ⎣ ⎦ ⎡ ′⎤ = _⎢ − − _⎥ ⎣ ⎦ β β β β β β β β β (2.9.9a)

Dari persamaan (2.9.8), dengan mensubstitusikan Y X= β ε + diperoleh

(

)

(

)

(

)

(

)

1 1 1 ˆ _{X X} _{X X} X X X ˆ _{X X} _X − − − ′ ′ = + ′ ′ = + ′ ′ − = β β ε β ε β β ε (2.9.9b)

Substitusikan persamaan (2.9.9b) ke (2.9.9a), sehingga diperoleh:

Cov ˆ

( )

= ⎢E⎡

(

X X′

)

−1X′

)

(

X X′

)

−1X′

)

′⎤_⎥ ⎣ ⎦ β ε ε = ⎣E⎡

(

X X′

)

−1X′ ′εε X X X

(

′

)

−1⎤_⎦ =

(

X X′

)

−1X′E

( ) (

εε′ X X X′

)

−1

(

)

1 ₂

(

)

1 X X′ − X′ IX X X′ − = σ

(

)

1 2 _{X X}′ − = σ

2.9.2.2 Generalized Least Squares (GLS)

Pada penaksiran dengan OLS, asumsi-asumsi yang digunakan dalam model regresi linier y X= β ε adalah + E

( )

ε =0dan V

( )

ε =σ2I. Asumsi variansi error _{σ disebut asumsi variansi error spherical,}2_I

(24)

yakni error tidak berkorelasi dan mempunyai variansi yang sama (pada diagonal utama terdapat entri yang sama). Namun tidak tertutup

kemungkinan variansinya tidak sama, atau dengan kata lain terjadi heteroscedastic, sehingga dapat dinyatakan bahwa _V

( )

_ε = =_Σ _σ2_Ω_.

Dengan demikian pada penaksiran dengan GLS, jika diberikan model seperti pada persamaan (2.9.2)

y X= β ε + asumsi yang diberikan

( )

E ε =0 dan V

( )

ε = =Σ σ2Ω. (2.9.10) Dimana Ω adalah matriks yang diketahui dan berukuran n n× . Asumsi variansi error _Σ₌_{σ Ω}2 _{disebut asumsi variansi error}

nonspherical. Pada variansi error nonspherical ini terdapat dua

interpretasi. Pertama pengamatan y berkorelasi (jika pada Ω terdapat entri tidak nol selain diagonal utama). Kedua pengamatan y tidak berkorelasi namun memiliki variansi yang tidak sama (jika pada

Ω terdapat entri yang tidak sama di diagonal utamanya).

Untuk variansi error nonspherical tidak semua asumsi pada OLS terpenuhi sehingga diperlukan transformasi model untuk

kumpulan pengamatan yang baru agar dapat dipenuhi asumsi-asumsi pada metode OLS. Diketahui bahwa Σ σ= 2Ω adalah matriks

kovarians dari error, maka Ω harus nonsingular dan definit positif sehingga berdasarkan Dekomposisi Cholesky, terdapat matriks K yang

(25)

simetris dan nonsingular berukuran n n× , dimana K K KK′ = =Ω. Dimana matriks K merupakan square root dari Ω .

Didefinisikan variabel baru, yaitu

z K y, B K X, g K= −1 = −1 = −1_{ε (2.9.11)}

sehingga model regresi y X= β ε menjadi +

K y K X−1 = −1 _β+K−1_{ε (2.9.12)}, atau

z B= β+g (2.9.13) Error pada model yang ditransformasi ini memiliki mean nol, yaitu E

( )

g =K−1E

( )

ε =0. Sedangkan matriks kovariansi untuk g adalah: V

( )

g =E⎡_⎢

(

g−E

( )

g

)

(

g−E

( )

g

)

′⎤_⎥ ⎣ ⎦ =E

( )

gg′ =E

(

K−1εε′K−1

)

=K−1E

( )

εε′ K−1 =_σ2_K−1_Ω_K−1 =_σ2_{K KKK}−1 −1 =σ2I (2.9.14) Maka elemen dari g memiliki mean nol dan variansi konstan dan tidak berkorelasi. Karena error g dalam model z B= β+g telah memenuhi

(26)

asumsi tersebut, maka dapat diterapkan OLS. Fungsi Least squares-nya adalah

( )

(

)

(

)

1 1 g g y X y X S − − ′ = ′ = ′ = − − β ε Ω ε β Ω β (2.9.15)

dan diperoleh persamaan normal least squares adalah

(

_X′_Ω−1_X

)

_βˆ =_X′_Ω−1_y

. (2.9.16) Penyelesaian untuk persamaan ini adalah

βˆ =

(

X′Ω−1X X

)

-1 ′Ω−1y (2.9.17) dimana ˆβ pada persamaan (2.9.17) disebut sebagai taksiran

generalized least squares untuk β .

Ekspektasi dan kovariansi dari taksiran parameter dengan metode generalized least squares:

1. _E

( )

ˆ _E⎡

(

_X′ −1_{X X}

)

-1 ′ −1_y⎤ = ⎢_⎣ ⎥_⎦ β Ω Ω

(

)

-1

( )

1 1 X_′ − X X_′ −E y = Ω Ω

(

₁

)

-1 ₁ X_′ − X X_′ − X = Ω Ω β = β .

Karena itu, βˆ =

(

X′Ω−1X X

)

-1 ′Ω−1y adalah penaksir yang unbiased untuk β .

(27)

2. Matriks kovariansi untuk ˆβ ialah

(

)

-1 1 1 cov_{⎣ ⎦}⎡ ⎤ˆ =cov_⎢⎡ X′ − X X′ − y⎤_⎥ ⎣ ⎦ β Ω Ω

(

₁

)

-1 ₁

( )

(

₁

)

-1 ₁ var X − X X − y X − X X − ′ ⎡ _′ _′ ⎤ ⎡ _′ _′ ⎤ = ⎢_⎣ Ω Ω ⎥_⎦ ⎢_⎣ Ω Ω ⎥_⎦

(

₁

)

-1 ₁ ₂

(

₁

)

-1 ₁ σ − − − − ′ ⎡ _′ _′ ⎤ ⎡ _′ _′ ⎤ = ⎢_⎣ X Ω X X Ω _⎦⎥ Ω⎢_⎣ X Ω X X Ω ⎥_⎦

(

)

-1

(

)

-1 1 1 _σ2 1 1 − − − − ⎡ _′ _′ ⎤ ⎡ _′ ⎤ = ⎢_⎣ X Ω X X Ω ⎥_⎦ Ω Ω⎢_⎣ X X Ω X ⎥_⎦

(

)

-1 2 _X 1_X σ _′ − = Ω .

2.10 Effects Models pada Data Panel

2.10.1 Fixed Effects Models pada Data Panel

Suatu effects dikatakan fixed effects, jika level dari faktor-faktornya dipilih tertentu berdasarkan keinginan peneliti dari populasi level yang ada, dan kesimpulan statistiknya terbatas hanya mengenai level-level tersebut. Model yang hanya mempunyai fixed effects

disebut fixed effects models. Berarti pada situasi ini akan dilihat effects dari level-level tersebut pada model.

Pada model untuk data panel, effects dari level-level antara lain berasal dari individu dan waktu. Oleh karena individu dan waktu dipilih secara fixed maka effects hanya sebatas pada individu dan waktu yang dipilih tersebut. Dengan demikian, effects dari individu dan waktu

(28)

diasumsikan sebagai fixed parameter yang akan ditaksir dan hasil taksirannya akan berupa nilai atau konstanta yang merupakan

intercept pada model. Karena itu pada fixed effects models, perbedaan karakteristik individu dan waktu diakomodasikan pada intercept

sehingga intercept-nya berubah antar individu dan antar waktu.

2.10.2 Random Effects Models pada Data Panel

Sedangkan suatu effects disebut sebagai random effects, jika level dari faktor-faktornya dipilih secara acak dari populasi level yang ada dan kesimpulan statistiknya mengenai populasi level dari faktor di mana data tersebut diasumsikan berasal. Model yang hanya

mempunyai random effects disebut random effects models. Berarti pada situasi ini akan dilihat effects dari level-level tersebut pada model.

Pada model untuk data panel, effects dari level-level antara lain berasal dari individu dan waktu. Oleh karena individu dan waktu dipilih secara random maka effects dari individu dan waktu diasumsikan suatu variabel acak dan akan dilihat variabilitas masing-masing effects. Dengan demikian, pada random effects models perbedaan

karakteristik individu dan waktu diakomodasikan pada error dari model. Mengingat ada dua komponen yang mempunyai kontribusi pada

(29)

perlu diurai menjadi error untuk individu, error untuk komponen waktu, dan error gabungan. Hal ini disebut dengan komponen error dua arah. Diasumsikan komponen error

(

_0, 2

)

i

μ IID σ_μ , komponen error

(

2

)

0, t

λ IID σ_λ , dan komponen error

(

2

)

0,

it v

v IID σ . Dengan μ adalah _i komponen error untuk individu, λ adalah komponen error untuk _t waktu, dan v adalah komponen error gabungan. _it

2.11 Metode ANOVA

Metode ANOVA merupakan salah satu metode yang paling banyak digunakan dalam menaksir komponen variansi (variance components). Penaksir ANOVA merupakan penaksir jenis metode momen untuk model ANOVA, yang berarti menyamakan quadratic sums of squares dengan ekspektasinya kemudian menyelesaikan sistem persamaan linear yang muncul akibat menyamakan dua hal tersebut.

Selanjutnya akan dijelaskan gambaran umum dari metode ANOVA. Misalkan σ adalah vektor dari komponen variansi yang akan 2 ditaksir, kemudian s adalah vektor dari sums of squares. Kemudian untuk masing-masing sums of squares, akan diperoleh nilai ekspektasi yang merupakan fungsi linear dari komponen variansi. Misalkan E(s) adalah vektor dari fungsi linear tersebut yang didefinisikan sebagai

(30)

( )

s C

E = σ2 (2.11.1)

dengan C adalah matriks nonsingular.

Kemudian berdasarkan metode penaksiran ANOVA, maka persamaan (2.11.1) menjadi

ˆ s C= σ 2

dengan ˆσ merupakan penaksir dari 2 σ . Dengan demikian, 2 persamaan tersebut dapat diubah menjadi

ˆ2 ₌C s-1

σ . (2.11.2)

Dapat dikatakan bahwa tiap-tiap elemen dari ˆσ adalah kombinasi 2 linear dari sums of squares di s.

Penaksir pada persamaan (2.11.2) selalu unbiased, sebagaimana yang ditunjukkan

( )

ˆ C-1

( )

s C C-1

E _σ2 ₌ E ₌ _σ2 ₌_{σ .}2

Untuk memberikan gambaran lebih jelas, misal diberikan random effects model ANOVA untuk data tidak lengkap (incomplete data) untuk 1,..., dan 1,..., ij i ij i y i a j n μ α ε = + + = = (2.11.3)

dengan yij observasi ke-j pada kelas ke-i, μ adalah general mean, α_i adalah pengaruh pada variabel y yang diobservasi dan terdapat pada

(31)

kelas ke-i, dan ε_ij adalah residual. Diasumsikan

(

2

)

0, i IID σα α dan

(

_0, 2

)

ij IID σε ε .

Jika dibentuk ke dalam formulasi matriks maka persamaan (2.11.3) dapat dibentuk menjadi

( )

i

Nμ+ diag n

y=ι ι α ε+ . (2.11.4)

Dapat diperoleh bahwa ekspektasi dari y

( )

N

(

( )

ni

)

( )

E y =E ι μ + E diag ι α +E ε

( )

_i

( )

NE μ + diag n E α E ε =ι ι +

( )

i NE μ + diag n 0 0 =ι ι +

( )

NE μ =ι Nμ =ι

dan variansi dari y

( )

(

( )

)

var var i Nμ+ diag n V = y = ι ι α ε+

( )

ni

(

( )

ni

)

( )

E diag⎛ α diag α ′⎞ E εε′ = _⎜ _⎟+ ⎝ ι ι ⎠

( )

ni

(

)

( )

ni

( )

diag E αα′ diag ′ E εε′ = ι ι +

( )

2

( )

2 i i n a n N diag σ_αI diag ′ σ_εI = ι ι +

( )

2 2 i n N diag α ε σ J σ I = +

(32)

(

2 2

)

i i

n n

diag σ_αJ σ_εI

= +

sehingga diperoleh bahwa

(

2 2

)

i i

N n n

IID μ diag σ_α σ_ε

y ι , V= J + I .(2.11.5)

Didefinisikan Between dan Within Sums of Squares yang merupakan dasar dari analysis of variance untuk persamaan (2.11.3) adalah

(

)

2 ₂ ₂ . .. . .. 1 SSA a i i i i i i n y y n y Ny = =

∑

− =

∑

− (2.11.6)

(

)

2 ₂ ₂ . . 1 1 SSE i n a ij i i j ij i i i i j y y y n y = = =

∑∑

− =

∑ ∑

−

∑

(2.11.7) dengan N =

∑

_in_i .

Persamaan (2.11.6) dan (2.11.7) jika ditransformasi ke dalam bentuk matriks akan menjadi

2 2 . .. SSA=

∑

_in y_i _i −Ny . i .. i n N iy ′ y ′ =

∑

ι y− ι y

( )

diag y J y y J y i n N ′ ′ = −

( )

untuk diag y A y A J J i 1 1 n N ′ = = − (2.11.8) dan 2 2 . SSE=

∑ ∑

_i _jy_ij −

∑

_in y_i _i . i i n iy ′ ′ =y y−

∑

ι y

(33)

( )

ni diag y I y y′_N ′ J y = −

( )

untuk diag _n_i y A y′ ₂ A₂ I_N J = = − . (2.11.9)

Selanjutnya akan diperoleh ekspektasi dari masing-masing sum of squares dalam formulasi matriks berdasarkan teorema 2.8.3.1 dan pernyataan (2.11.5) adalah:

(

SSA

)

(

)

E =E y A y′ ₁

(

1

)

( )

1

( )

tr E ′ E = AV + y A y

( )

(

)

(

2 2

)

i i i n N n n tr⎡ diag diag σ_α σ_ε ⎤ = _⎣ J −J ⋅ J + I _⎦

( )

(

i

)

N diag n N N μ ′ μ + ι J −J ι

(

)

(

)

(

( )

)

2 i i i n n N n tr diag tr diag α σ ⎡ ⎤ = _⎣ J J − J J _⎦

( )

(

)

( )

(

)

2 2 2 2 i i n N _i i n N tr diag tr n N ε σ μ ⎛ ⎞ + − + _⎜ − _⎟ ⎝

∑

⎠ J J 2 2 2 i i i 2 i i i i i n n n N n N n N α ε σ ⎛ ⎞ σ ⎛ ⎞ = ⎜_⎜ − ⎟_⎟+ _⎜ − _⎟ ⎝ ⎠ ⎝ ⎠

∑

(

)

2 2 2 1 i in N a N σα σε ⎛ ⎞ =⎜_⎜ − ⎟_⎟ + − ⎝ ⎠

∑

_{. (2.11.10)} dan

(

SSE

)

(

)

E =E y A y′ ₂

(

2

)

( )

2

( )

tr E ′ E = A V + y A y

(34)

( )

(

)

(

2 2

)

i i i n n n tr⎡ diag diag σ_α σ_ε ⎤ = _⎣ I_N − J ⋅ J + I _⎦

( )

(

i

)

N diag n N μ ′ μ + ι I_N − J ι

( )

(

)

(

)

2 i i i N n n n tr diag tr diag α σ ⎡ ⎤ = _⎣ I ⋅ J − J J _⎦

( )

(

)

(

)

2 i i i N n n n tr diag tr diag ε σ ⎡ ⎤ + _⎣ I ⋅ I − J I _⎦ 2 2 i i i n N n μ ⎛ ⎞ + _⎜ − _⎟ ⎝

∑

⎠

(

)

2 ₂ 2 i i i 2 i i n _n N a N n α ε σ ⎛ ⎞ σ = ⎜_⎜ − ⎟_⎟+ − ⎝ ⎠

∑

_∑

(

)

2 2 N _N 2 _{N a} N α ε σ ⎛ ⎞ σ = _⎜ − _⎟+ − ⎝ ⎠

(

)

2 _{N a} ε σ = − . (2.11.11)

Berdasarkan prinsip metode momen pada penaksiran ANOVA maka dilakukan penyamaan antara persamaan (2.11.8) dengan persamaan (2.11.10) dan persamaan (2.11.9) dengan persamaan (2.11.11). Kemudian σ_ε2 dan σ_α2 pada persamaan (2.11.10) dan (2.11.11) disubstitusi dengan σˆ_ε2 dan σˆ_α2, sehingga diperoleh

(

)

(

)

2 2 2 2 SSA ˆ 1 ˆ SSE ˆ i in N a N N a α ε ε σ σ σ ⎛ ⎞ =⎜_⎜ − ⎟_⎟ + − ⎝ ⎠ = −

∑

. (2.11.12)

(35)

(

)

2 SSE ˆ N - a ε σ = dan 2

(

) ( )

2 SSA SSE ˆ 1 -i i a N a n N N α σ = − − ⎛ ⎞ − ⎜ ⎟ ⎜ ⎟ ⎝ ⎠

∑

(2.11.13)

Jika disesuaikan dengan bentuk umum yang sebelumnya diperoleh dari metode ANOVA, maka

C ˆσ = s 2

(

)

2 2 2 0 SSE ˆ SSA 1 i i ˆ N a n a N N ε α σ σ ⎡ − ⎤ ⎢ _⎛ _⎞⎥ ⎡ ⎤ ⎡ ⎤ = ⎢ ₋ _⎜ ₋ _⎟⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ ⎢ _⎜ _⎟⎥ ⎝ ⎠ ⎣ ⎦

∑

(2.11.14)

sehingga dengan metode ANOVA diperoleh ˆ2 ₌C s-1 σ ( ) ( ) ( ) 2 1 2 1 ₁ 2 0 SSE ˆ SSA ˆ _i i N a a N a _n N N ε α σ σ − − − − ⎛ ⎞ ⎜ − ⎟ ⎜ ⎟ ⎝ ⎠ ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎡ ⎤ = ⎢ ⎥ ⎢ ⎥ _∑ ⎢ ⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ (2.11.15)