Pada Bab II ini akan dibahas dasar-dasar teori yang digunakan dalam penulisan skripsi yaitu mengenai data panel, beberapa bentuk dan sifat matriks, matriks partisi, bentuk linier dan bentuk kuadratik beserta ekspektasinya, regresi linear beserta metode penaksirannya, dan juga metode ANOVA.
2.1 Data Panel
2.1.1 Definisi dan Deskripsi Data Panel
Telah diketahui bahwa data cross section merupakan data yang dikumpulkan pada satu waktu terhadap banyak individu. Sedangkan data time series adalah data yang dikumpulkan dari waktu ke waktu terhadap suatu individu. Berdasarkan Nachrowi (2006), data cross section yang dikumpulkan atau diobservasi pada periode waktu tertentu dikenal dengan nama data panel.
Dalam analisis perekonomian, data panel ini sangat banyak ditemui. Misalkan data pertumbuhan perekonomian provinsi-provinsi di Indonesia dari tahun 2000 sampai 2007. Data ini merupakan kumpulan informasi terhadap semua provinsi di Indonesia yang berjumlah 33 provinsi dan dikumpulkan selama jangka waktu 8 tahun.
Data panel terdiri dari dua bentuk, yaitu data panel lengkap (complete panel data) dan data panel tidak lengkap (incomplete panel data). Baik data panel tidak lengkap maupun data panel lengkap mempunyai model regresi yang sama, yakni yit = +α x βitk k +uit. Berdasarkan komponen error u , model regresi untuk data panel it lengkap dan data panel tidak lengkap dibedakan menjadi dua, yaitu model regresi komponen error satu arah (one-way error component regression models), dengan uit =μi +vit dan model regresi komponen error dua arah (two-way error component regression models), dengan
uit =μ λi+ +t vit.
Diberikan bahwa μi adalah pengaruh khusus yang tidak teramati (error) dari individu ke-i tanpa dipengaruhi waktu, misalkan kemampuan atau keunggulan khusus dari suatu individu yang tidak dimiliki oleh individu lainnya. λt adalah pengaruh yang tidak teramati pada waktu ke-t tanpa dipengaruhi individu, misalkan pada suatu waktu tertentu ada peristiwa yang tidak terobservasi yang
mengakibatkan hasil observasi menjadi tidak lazim dari waktu sebelumnya. Selanjutnya vit adalah pengaruh (error) yang benar-benar tidak diketahui (remainder disturbance).
Pada data panel lengkap baik untuk model regresi komponen error satu arah maupun model regresi komponen error dua arah
sama-sama memiliki banyak elemen individu i= 1, …, N dan banyak elemen periode atau waktu t= 1, …, T. Dengan kata lain kedua model regresi tersebut memiliki dimensi NT.
Namun pada data panel tidak lengkap, untuk model regresi komponen error satu arah banyaknya elemen individu i= 1, …, N dan banyaknya elemen waktu t= 1, …, Ti (sebanyak N individu yang
diobservasi, data untuk masing-masing individu tersebut diambil pada periode ke-i, yaitu masing-masing individu memiliki data dengan periode waktu yang berbeda). Sedangkan untuk model regresi
komponen error dua arah banyaknya elemen individu i=1,…,Nt (jumlah
individu yang diobservasi pada tahun ke-t berbeda-beda) dengan elemen waktu t=1,…,T.
2.1.2 Kelebihan Data Panel
Beberapa kelebihan dari data panel, antara lain:
1. Data panel dapat memberikan informasi yang lebih jelas tentang keberagaman suatu data. Hal ini disebabkan karena data panel,
sesuai dengan definisi sebelumnya, dikumpulkan atau diobservasi dari beberapa individu yang beragam pada periode waktu tertentu.
Sedangkan pada data cross section, data diobservasi dari beberapa individu yang beragam, namun pada satu waktu tertentu. Dengan demikian, data panel akan lebih beragam daripada data cross section.
Begitu pula dengan data time series, data dikumpulkan dari satu individu pada periode waktu tertentu. Tentunya, data time series kurang beragam daripada data panel.
2. Menyediakan data yang lebih banyak sehingga data yang ada menjadi lebih informatif, lebih bervariasi, dan efisien. Alasannya, hal ini sesuai dengan definisi data panel, yang merupakan kombinasi dari data cross section dan data time series.
2.1.3 Kekurangan Data Panel
Namun kekurangan dari data panel:
1. Data panel sering bermasalah dalam hal pengumpulan data. Ini disebabkan karena pengumpulan data panel tidak hanya
membutuhkan dana dan tenaga kerja yang besar, tetapi juga waktu yang lama.
2. Setelah dilakukan pengumpulan data, tentu data panel akan dianalisis lebih lanjut. Hal ini berakibat model yang menggunakan data ini
menjadi lebih kompleks karena tidak hanya menganalisa individu saja tetapi juga waktu. Dengan demikian diperlukan teknik tersendiri dalam menganalisis model yang menggunakan data panel.
2.2 Notasi dan Terminologi Matriks
Matriks adalah suatu susunan bilangan berbentuk segiempat. Bilangan-bilangan dalam susunan itu disebut entri dalam matriks.
Ukuran matriks ditentukan oleh banyaknya baris dan banyaknya kolom yang dimiliki oleh matriks tersebut. Matriks yang hanya terdiri dari satu kolom yaitu berukuran m×1 disebut matriks kolom (atau vektor kolom), dan matriks yang terdiri dari satu baris yaitu berukuran
×
1 n disebut matriks baris (atau vektor baris).
Dalam tugas akhir ini matriks dinotasikan dengan huruf kapital yang dicetak tebal dan vektor dinotasikan dengan huruf kecil dicetak tebal. Matriks A berukuran m n× adalah matriks yang terdiri dari m baris dan n kolom dengan entri pada baris ke-i dan kolom ke-j dapat dinyatakan dengan simbol
( )
A ij =aij, sehinggaA n n m m mn a a a a a a a a a ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ = ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ 11 12 1 21 22 2 1 2 L L M M M L . (2.2.1)
Persamaan (2.2.1) dapat dituliskan dengan A= ⎣ ⎦ atau ⎡ ⎤aij m n× ⎡ ⎤⎣ ⎦ . aij Sebagai contoh, matriks A
1 2 3 4 ⎡ ⎤ = ⎢ ⎥ ⎣ ⎦ A memiliki entri
( )
( )
( )
( )
11=1, 2, 3 12 = 21= dan 4.22 = A A A AMatriks A yang memiliki n baris dan n kolom disebut matriks bujur sangkar berorde n, dan entri a a11, 22,K,anndisebut sebagai diagonal utama dari A (lihat entri yang dilingkari), dengan
11 12 1 21 22 2 1 2 A ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ = ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ n n n n nn a a a a a a a a a L L M M M L .
Berikut ini akan dibahas beberapa operasi atau sifat matriks dan beberapa matriks bentuk khusus yang dipakai pada tugas akhir ini.
2.3 Trace Matriks
Misalkan A= ⎣ ⎦⎡ ⎤aij suatu matriks persegi berukuran n n× , maka trace dari A didefinisikan sebagai jumlah dari elemen diagonal A dan dinotasikan dengan tr A
( )
, yaitu tr( )
A =a11+a22+ +K ann. Beberapa sifat dari trace lainnya adalah sebagai berikut:1. tr
( )
In =n 2. tr k⎡⎣( )
⎤ =⎦ k 3. tr k( )
A = ⋅k tr( )
A 4. tr(
A B+)
=tr( )
A +tr( )
Bdimana k adalah sembarang skalar, sedangkan A dan B adalah matriks berukuran n n× . Untuk k k1, 2, K, kr adalah sembarang skalar dan A A1, 2, K, Ar adalah matriks berukuran n n× maka
( )
1 1 tr tr . = = ⎛ ⎞= ⎜ ⎟ ⎝∑
A ⎠∑
A r r i i i i i i k kJika A adalah matriks persegi dengan A A11, 22, K, Akk adalah matriks partisi dari 11 12 1 21 22 2 1 2 ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ =⎜ ⎟ ⎜ ⎟ ⎝ ⎠ A A A A A A A A A A L L M M O M L k k k k kk maka tr
( )
A =tr( ) (
A11 +tr A22)
+K+tr( )
Akk .Misalkan A= ⎣ ⎦⎡ ⎤aij adalah matriks berukuran m n× dan b
⎡ ⎤ = ⎣ ⎦
B ij adalah matriks berukuran n m× , maka
( )
1 1 tr a b = = =
∑∑
AB m n ij ji i j dimana 1 a b = ⎡ ⎤ = ⎢ ⎥ ⎣∑
⎦ AB n ij ji j. Berdasarkan persamaan (2.3.1) dan sifat
transpos matriks maka
tr
( )
AB =tr(
B A′ ′)
(2.3.2) yang dapat diperluas sebagaimana diberikan pada lemma berikut ini.Lemma 2.3.1 Untuk sembarang matriks A berukuran m n× dan matriks B berukuran n m× maka tr
( )
AB =tr( )
BA .( )
( )
1 1 1 1 1 1 tr a b a b b a tr = = = = = = =∑∑
=∑∑
=∑∑
= AB m n ij ji n m ij ji n m ji ij BA i j j i j iCatatan: Berdasarkan persamaan (2.3.2) dan lemma 2.3.1, untuk sembarang matriks A berukuran m n× dan matriks B berukuran n m× , maka tr
( )
AB =tr(
B A′ ′)
=tr(
A B′ ′)
=tr( )
BA .Bentuk di atas dapat diperluas untuk trace dari perkalian matriks ABC di mana A matriks berukuran m n× , B matriks berukuran n p× , dan
C matriks berukuran p m× sehingga
tr
(
ABC)
=tr(
CAB)
=tr(
BCA)
. (2.3.3)2.4 Matriks Partisi
Setiap matriks bisa dibagi atau dipartisi menjadi matriks-matriks yang lebih kecil. Matriks yang lebih kecil itu disebut submatriks.
Berikut ini akan diberikan contoh tiga partisi yang mungkin dari sebuah matriks A yang berukuran 3 4× , yaitu:
11 12 13 14 11 12 21 22 23 24 21 22 31 32 33 34 A A A A A a a a a a a a a a a a a ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ =⎢ ⎥ ⎢= ⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ (2.4.1) ⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ =⎢ ⎥ ⎢ ⎥= ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ 11 12 13 14 1 21 22 23 24 2 31 32 33 34 3 r A r r a a a a a a a a a a a a (2.4.2)
[
]
⎡ ⎤ ⎢ ⎥ =⎢ ⎥= ⎢ ⎥ ⎣ ⎦ 11 12 13 14 21 22 23 24 1 2 3 4 31 32 33 34 A c c c c a a a a a a a a a a a a (2.4.3)Jika terdapat dua matriks yang dapat dipartisi yang bersesuaian A dan B, sehingga masing-masing submatriks yang dimiliki juga
bersesuaian. Maka perkalian AB diperoleh menggunakan pola perkalian matriks biasa, yakni contohnya
11 12 11 12 21 22 21 22 A A B B AB A A B B ⎛ ⎞⎛ ⎞ = ⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠ 11 11 12 21 11 12 12 22 21 11 22 21 21 12 22 22 A B A B A B A B A B A B A B A B + + ⎛ ⎞ = ⎜ + + ⎟ ⎝ ⎠ (2.4.4) 2.5 Matriks Diagonal
Suatu matriks A= ⎣ ⎦⎡ ⎤aij yang berukuran n n× yang memiliki elemen diagonal utama a a11, 22,K,ann dikatakan matriks diagonal, jika elemen selain diagonal utama dari matriks tersebut adalah nol.
Contoh, misalkan terdapat matriks
( )
3 2 6 3 0 0 2 10 7 , maka 0 10 0 6 7 9 0 0 9 diag ⎛ ⎞ ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ =⎜ − ⎟ =⎜ ⎟ ⎜ − ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ A A .Selain itu misalkan B merupakan matriks partisi
( )
, maka diag ⎛ ⎞ ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ =⎜ ⎟ =⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ 11 12 13 11 21 22 23 22 31 32 33 33 B B B B 0 0 B B B B B 0 B 0 B B B 0 0 B .2.6 Matriks Bentuk Khusus dan Operasinya
2.6.1 Summing Vectors, Matriks – J, dan Matriks – E
Vektor yang tiap elemennya hanya berisikan bilangan 1 disebut summing vectors dan dinotasikan dengan ι , misalkan ι3 =
[
1 1 1]
′. Ini disebut summing vectors dikarenakan jika x= ⎡⎣x1 x2 x3⎤⎦′,3 3′ =x
∑
i=1xiι .
Matriks – J merupakan matriks bujur sangkar yang dihasilkan dari perkalian summing vectors
1 1 1 1 1 1 1 1 1 n n Jn L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ′ = = ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ι ι
dengan vektor ιn berukuran 1n× dan matriks J berukuran n n n× . Beberapa sifat dari matriks – J antara lain
1). J2n =nJn 2). Jn nι =nιn 3). tr
( )
Jn =n4). 1 n n n J = J 5). J Jn n = Jn 6). tr
( )
Jn = 1 7). J2n =Jn.Kemudian didefinisikan matriks En = −In Jn berukuran n x n, dengan In matriks identitas ukuran n x n. Beberapa sifat dari matriks – E yakni
1). tr
( )
En = −n 1 2). Eι =03). E2 = E
2.6.2 Matriks – Q, Matriks – P, dan Matriks – Z
Didefinisikan matriks – Q merupakan matriks bujur sangkar yang berbentuk matriks diagonal
( )
1 2 i n diag E 0 0 0 E 0 Q E 0 0 E L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ = =⎜ ⎟ ⎜ ⎟ ⎝ ⎠ . (2.6.1)Pada model regresi untuk data panel, matriks – Q berperan sebagai matriks deviasi dari mean individu. Misal diberikan suatu vektor u berukuran 1n× maka Qu=
(
ui −u.)
, dengan i = 1, ..., n.Kemudian matriks – P didefinisikan sebagai matriks diagonal
( )
1 2 i n diag J 0 0 0 J 0 P J 0 0 J L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ = = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ . (2.6.2)Dalam model regresi untuk data panel, matriks – P berperan sebagai matriks rata-rata dari observasi sepanjang waktu untuk masing-masing individu. Misalkan diberikan diberikan suatu vektor u, berukuran n× , 1
maka 1 . n i i u u n = = =
∑
Pu , dengan i = 1, ..., n.Selanjutnya untuk matriks – Z didefinisikan
( )
1 2 i n diag 0 0 0 0 Z 0 0 L L M M O M L ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ = = ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ι ι ι ι . (2.6.3)Pada model regresi untuk data panel, matriks – Z berperan sebagai matriks yang menyederhanakan penulisan pengaruh yang tidak teramati dari individu, μi, dengan periode waktu yang berbeda-beda, t=1,…,Ti.
2.7 Bentuk-bentuk Matriks Lainnya
Definisi 2.7.1 Didefinisikan A adalah matriks yang berukuran n n× , maka A dikatakan matriks simetris jika A A′= .
Definisi 2.7.2 Misalkan A adalah matriks yang berukuran n n× , maka A dikatakan matriks idempotent jika A AA= .
Jika A juga merupakan matriks simetris, maka A dikatakan symmetric idempotent. Jika A symmetric idempotent, maka I A− juga symmetric idempotent.
Definisi 2.7.3 Misalkan A adalah matriks yang berukuran n n× , maka A dikatakan matriks ortogonal, jika A A I′ = . Maka dapat dinyatakan bahwa A−1=A′.
Lemma 2.7.4 Diketahui suatu matriks X, yang berukuran n K× , dan X adalah matriks full rank, maka
(
′)
-1 ′X X X X merupakan matriks idempotent. Bukti:
(
)
(
′ -1 ′)
(
(
′)
-1 ′)
(
′) (
-1 ′)(
′)
-1 ′ = X X X X X X X X X X X X X X X X(
′)
-1 ′ =X X X I X n(
′)
-1 ′ = X X X X2.8 Bentuk Linier dan Bentuk Kuadratik 2.8.1 Notasi Bentuk Linier
Misalkan a=
[
a1, ,K a ′n]
adalah vektor kolom berdimensi n, dan pandang fungsi a x′ =∑
ia xi i , dengan vektor x=[
x1, ,K x ′n]
di n. Fungsi tersebut merupakan fungsi bentuk linier.2.8.2 Notasi Bentuk Kuadratik, Definit Positif dan Semidefinit Positif
Misalkan matriks A= ⎣ ⎦ berukuran ⎡ ⎤aij n n× dan pandang fungsi
2 , , x Ax ij i j i i ij i j i j i i j i a x x a x a x x ≠ ′ =
∑
=∑
+∑
(2.8.1)dengan vektor x=
[
x1, ,K x ′n]
di n. Fungsi pada persamaan (2.8.1) merupakan bentuk kuadratik.Definisi 2.8.2.1 Misalkan x Ax′ merupakan bentuk kuadratik dengan A= ⎣ ⎦ adalah matriks berukuran ⎡ ⎤aij n n× dan vektor x=
[
x1, ,K x ′n]
din
. Bentuk kuadratik dikatakan definit positif jika 0 untuk setiap 0
x A x′ > , x≠ (2.8.2a) Bentuk kuadratik dikatakan semidefinit positif jika
0 untuk setiap 0
x A x′ ≥ , x≠ (2.8.2b) Matriks definit positif dapat difaktorisasi ke dalam bentuk matriks akar kuadrat yang dikenal dengan Cholesky decomposition. Misalkan A
matriks definit positif ukuran n n× , maka matriks tersebut dapat difaktorkan menjadi
′ = A T T .
Dimana T adalah matriks segitiga atas nonsingular.
Definisi 2.8.2.2 Matriks simetris A disebut matriks definit positif jika x Ax′ adalah bentuk kuadratik definit positif.
Definisi 2.8.2.3 Matriks simetris A disebut matriks semidefinit positif jika x Ax′ adalah bentuk kuadratik semidefinit positif.
Berikut ini adalah lemma mengenai matriks definit positif yang merupakan matriks nonsingular.
Lemma 2.8.2.4 Sembarang matriks definit positif adalah nonsingular. Bukti:
Misalkan matriks A berukuran n n× merupakan matriks definit positif. Lemma 2.8.2.4 akan dibuktikan dengan menggunakan kontradiksi. Andaikan A merupakan matriks singular atau secara ekuivalen
( )
A .rank <n Akibatnya, kolom A tidak bebas linier dan terdapat vektor tidak nol x , sedemikian sehingga * A x* = . Oleh karena itu 0
(
)
0* * * * *
x A x′ =x A x′ =x 0′ = . Padahal A merupakan matriks definit positif, artinya
0 untuk setiap 0 x A x′ > , x≠ .
Sedangkan jika A merupakan matriks singular diperoleh bahwa
(
)
0* * * * *
x A x′ =x A x′ =x 0′ =
Berarti kontradiksi dengan pengandaian yang digunakan. Sehingga sembarang matriks definit positif adalah nonsingular.
2.8.3 Ekspektasi dari Bentuk Kuadratik
Teorema 2.8.3.1 Jika y adalah suatu vektor acak dengan mean μ dan matriks kovarians Σ , dan jika terdapat matriks simetris A, maka
(
)
( )
E y Ay′ =tr AΣ +μ μ′A (2.8.3) Bukti:
Diketahui bahwa cov
(
y yi, j) ( )
=E y yi j −μ μi j, yang jika dibentuk dalam format matriks menjadi Σ=E( )
yy′ −μμ′. Kemudian dapat diubah ke dalam bentuk( )
E yy′ = +Σ μμ′. (2.8.4)
Diketahui bahwa y Ay′ adalah suatu skalar, yang nilainya sama dengan nilai trace-nya. Selanjutnya didapatkan
(
)
(
)
E y Ay′ = ⎣E tr⎡ y Ay′ ⎤⎦(
)
E tr⎡ Ayy′ ⎤ = ⎣ ⎦(
)
tr E⎡ Ayy′ ⎤ = ⎣ ⎦( )
tr⎡AE yy′ ⎤ = ⎣ ⎦(
)
tr⎡A Σ ′ ⎤ = ⎣ +μμ ⎦[
]
tr AΣ A ′ = + μμ( )
(
)
tr AΣ tr A ′ = + μμ( )
(
)
tr AΣ tr ′A = + μ μ (dari lemma 2.3.1)( )
tr AΣ ′A = +μ μ (2.8.5)Perlu diperhatikan bahwa y Ay′ bukan fungsi linear dari y, sehingga
(
)
( )
( )
E y Ay′ ≠E y A′ E y .
2.9 Regresi Linier Berganda
Analisis regresi adalah suatu metode yang digunakan dalam menganalisis satu atau lebih variabel prediktor X dengan satu variabel respon Y. Pola hubungan itu dapat dinyatakan dalam bentuk
persamaan regresi.
Model regresi linier yang melibatkan lebih dari satu variabel prediktor dengan satu variabel respon disebut model regresi linier berganda.
2.9.1 Model Regresi Linier Berganda
Pola hubungan antar variabel yang terdiri dari satu variabel tak bebas atau variabel respon y dan beberapa variabel bebas atau
variabel prediktor
(
x x1, , ,2 K xk)
dapat ditunjukkan oleh salah satu model regresi linier.Berikut ini akan diberikan ilustrasi data untuk regresi linier berganda, yaitu: Pengamatan i y x1 x2 K xk 1 y1 x11 x12 K x1k 2 y2 x21 x22 K x2k M M M M M n yn xn1 xn2 K xnk
Model regresi linier dapat dituliskan dalam bentuk sebagai berikut 0 1 1 2 2 0 1 , i i i k ik i k j ij i j y x x x x = = + + + + + = +
∑
+ K β β β β ε β β ε (2.9.1)=1 2K ialah banyaknya pengamatan. i , , ,n
Apabila dinyatakan dalam notasi matriks, maka persamaan (2.9.1) menjadi y X= β ε (2.9.2) + k k n n n nk k n y x x x y x x x y x x x y , X , , ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ = = = = ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ 1 11 12 1 0 1 2 21 22 2 1 2 1 2 1 1 1 L L M M M M M M M L β ε β ε β ε β ε dengan
X : matriks dari variabel prediktor yang berukuran n p× , dengan p k= + 1.
β : vektor kolom dari parameter yang berukuran p× . 1 ε : vektor kolom dari error yang berukuran n× 1. Model regresi linier berganda di atas mempunyai asumsi sebagai berikut:
( )
( )
(
)
i i j i E i n E i j i j N . , , , . . , = = = ≠ = 2 = 2 1 0 untuk 1 2 2 0 untuk untuk 3 0 K ε ε ε σ ε σDalam notasi matriks dinyatakan dengan:
( )
( )
1.
2. dengan merupakan matriks identitas
3. mempunyai distribusi normal dengan mean dan variansi
2 2 0 I, I 0 I. E E σ σ ε εε ε = ′ =
2.9.2 Taksiran Parameter Dalam Regresi Linier Berganda
Ada banyak metode yang dapat digunakan dalam menaksir parameter pada model regresi linier berganda. Berikut ini pembahasan mengenai beberapa metode taksiran.
Pada subbab ini dijelaskan metode taksiran Ordinary Least Squares (OLS), dan Generalized Least Squares (GLS) yang
digunakan untuk menaksir parameter pada model y X= β ε , dengan + X memiliki rank penuh, E y
( )
= βX danE( )
ε =0.2.9.2.1 Ordinary Least Squares (OLS)
Untuk menaksir parameter model regresi dengan menggunakan metode ordinary least squares maka asumsi-asumsi (1), (2), (3) yang telah disebutkan pada subbab 2.9.1 harus dipenuhi.
Fungsi least squares atau sum of squares of error (SSE) dinyatakan dengan:
(
)
2 0 1 1 2 0 1 1 , , , k n i i n k i j ij i j S S y x = = = = = ⎛ ⎞ = ⎜ − − ⎟ ⎝ ⎠∑
∑
∑
K β β β ε β β (2.9.3)Fungsi S akan diminimumkan terhadap β β0, ,1K,βk. Taksiran least squares dariβ β0, ,1K,βk harus memenuhi
0 1 0 1 1 0 2 0 (2.9.4a) k n k i j ij i j S y x = = ⎛ ⎞ ∂ = − ⎜ − − ⎟= ∂β β βˆ ˆ, , ,Kβˆ
∑
⎝ βˆ∑
βˆ ⎠(
)
0 1 0 1 1 dan 2 0 2.9.4b untuk setiap 1 2 k n k i j ij ij i j j S y x x j k = = ⎛ ⎞ ∂ = − − − = ⎜ ⎟ ∂ ⎝ ⎠ =∑
∑
ˆ ˆ, , ,ˆ ˆ ˆ , , , . K K β β β β β βDengan menguraikan persamaan (2.9.4a) dan (2.9.4b), diperoleh sistem persamaan normal:
n n n n i i k ik i i i i i n n n n n i i i i k i ik i i i i i i i n n n n n ik ik i ik i k ik ik i i i i i i n x x x y x x x x x x x y x x x x x x x y ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ 1 = = = = 1 = = = = = 1 = = = = = + + + + = + + + + = + + + + =
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
0 1 2 2 1 1 1 1 2 0 1 1 2 1 2 1 1 1 1 1 1 1 2 0 1 2 2 1 1 1 1 1 L L M M M M M L β β β β β β β β β β β β (2.9.5) Pada persamaan (2.9.5) terdapat p k= + persamaan normal, 1masing-masing memiliki koefisien regresi yang tidak diketahui. Dalam notasi matriks persamaan (2.9.3) adalah:
( )
(
) (
)
2 1 2 y X y X y y X y y X X X y y X y X X n i i S ε = = ′ = ′ = − − ′ ′ ′ ′ ′ ′ = − − + ′ ′ ′ ′ ′ = − +∑
β ε ε β β β β β β β β β. (2.9.6)Karena β′ ′X ymerupakan matriks berukuran 1 1 atau skalar dan × transposnya
(
β′ ′X y)
′ =y X′ β juga skalar yang sama, maka:2 2 sehingga, S ∂ = − ′ + ′ = ′ = ′ ∂ ˆ ˆ ˆ X y X X 0 X X X y β β β β (2.9.7)
disebut sebagai persamaan normal least squares, yang merupakan bentuk matriks dari persamaan (2.9.5).
Dengan mengalikan kedua ruas pada persamaan (2.9.7) dengan invers dari matriks X X′ yang nonsingular, didapat
penyelesaian sistem persamaan normal yang memberikan taksiran least squares β , yaitu:
(
)
1ˆ X X′ − X y′
=
β (2.9.8)
dengan syarat invers matriks
(
X X′)
−1 ada, jika variabel independent yang ada bersifat linearly independent.Ekspektasi dan kovariansi dari taksiran parameter dengan metode ordinary least squares adalah sebagai berikut:
1. E
( )
βˆ = ⎣E⎡(
X X′)
−1X y′ ⎦⎤(
)
1(
)
E⎡ ′ − ′ ⎤ = ⎣ X X X X β ε+ ⎦(
)
1(
)
1 E⎡ ′ − ′ ′ − ′ ⎤ = ⎣ X X X Xβ+ X X X ε⎦(
)
1( ) (
)
1( )
E E − − ′ ′ ′ ′ = X X X X β + X X X ε = βKarena E
( )
ε =0 dan(
X X′)
−1X X I.′ = Sehingga ˆβ merupakan taksiran unbiased untuk β .( )
(
( )
)
(
( )
)
(
)(
)
Cov ˆ ˆ ˆ ˆ ˆ ˆ ˆ E E E E ⎡ ′⎤ = ⎢ − − ⎥ ⎣ ⎦ ⎡ ′⎤ = ⎢ − − ⎥ ⎣ ⎦ β β β β β β β β β (2.9.9a)Dari persamaan (2.9.8), dengan mensubstitusikan Y X= β ε + diperoleh
(
)
(
)
(
)
(
)
1 1 1 ˆ X X X X X X X ˆ X X X − − − ′ ′ = + ′ ′ = + ′ ′ − = β β ε β ε β β ε (2.9.9b)Substitusikan persamaan (2.9.9b) ke (2.9.9a), sehingga diperoleh:
Cov ˆ
( )
= ⎢E⎡(
(
X X′)
−1X′)
(
(
X X′)
−1X′)
′⎤⎥ ⎣ ⎦ β ε ε = ⎣E⎡(
X X′)
−1X′ ′εε X X X(
′)
−1⎤⎦ =(
X X′)
−1X′E( ) (
εε′ X X X′)
−1(
)
1 2(
)
1 X X′ − X′ IX X X′ − = σ(
)
1 2 X X′ − = σ2.9.2.2 Generalized Least Squares (GLS)
Pada penaksiran dengan OLS, asumsi-asumsi yang digunakan dalam model regresi linier y X= β ε adalah + E
( )
ε =0dan V( )
ε =σ2I. Asumsi variansi error σ disebut asumsi variansi error spherical, 2Iyakni error tidak berkorelasi dan mempunyai variansi yang sama (pada diagonal utama terdapat entri yang sama). Namun tidak tertutup
kemungkinan variansinya tidak sama, atau dengan kata lain terjadi heteroscedastic, sehingga dapat dinyatakan bahwa V
( )
ε = =Σ σ2Ω.Dengan demikian pada penaksiran dengan GLS, jika diberikan model seperti pada persamaan (2.9.2)
y X= β ε + asumsi yang diberikan
( )
E ε =0 dan V
( )
ε = =Σ σ2Ω. (2.9.10) Dimana Ω adalah matriks yang diketahui dan berukuran n n× . Asumsi variansi error Σ=σ Ω2 disebut asumsi variansi errornonspherical. Pada variansi error nonspherical ini terdapat dua
interpretasi. Pertama pengamatan y berkorelasi (jika pada Ω terdapat entri tidak nol selain diagonal utama). Kedua pengamatan y tidak berkorelasi namun memiliki variansi yang tidak sama (jika pada
Ω terdapat entri yang tidak sama di diagonal utamanya).
Untuk variansi error nonspherical tidak semua asumsi pada OLS terpenuhi sehingga diperlukan transformasi model untuk
kumpulan pengamatan yang baru agar dapat dipenuhi asumsi-asumsi pada metode OLS. Diketahui bahwa Σ σ= 2Ω adalah matriks
kovarians dari error, maka Ω harus nonsingular dan definit positif sehingga berdasarkan Dekomposisi Cholesky, terdapat matriks K yang
simetris dan nonsingular berukuran n n× , dimana K K KK′ = =Ω. Dimana matriks K merupakan square root dari Ω .
Didefinisikan variabel baru, yaitu
z K y, B K X, g K= −1 = −1 = −1ε (2.9.11)
sehingga model regresi y X= β ε menjadi +
K y K X−1 = −1 β+K−1ε (2.9.12) , atau
z B= β+g (2.9.13) Error pada model yang ditransformasi ini memiliki mean nol, yaitu E
( )
g =K−1E( )
ε =0. Sedangkan matriks kovariansi untuk g adalah: V( )
g =E⎡⎢(
g−E( )
g)
(
g−E( )
g)
′⎤⎥ ⎣ ⎦ =E( )
gg′ =E(
K−1εε′K−1)
=K−1E( )
εε′ K−1 =σ2K−1ΩK−1 =σ2K KKK−1 −1 =σ2I (2.9.14) Maka elemen dari g memiliki mean nol dan variansi konstan dan tidak berkorelasi. Karena error g dalam model z B= β+g telah memenuhiasumsi tersebut, maka dapat diterapkan OLS. Fungsi Least squares-nya adalah
( )
(
)
(
)
1 1 g g y X y X S − − ′ = ′ = ′ = − − β ε Ω ε β Ω β (2.9.15)dan diperoleh persamaan normal least squares adalah
(
X′Ω−1X)
βˆ =X′Ω−1y. (2.9.16) Penyelesaian untuk persamaan ini adalah
βˆ =
(
X′Ω−1X X)
-1 ′Ω−1y (2.9.17) dimana ˆβ pada persamaan (2.9.17) disebut sebagai taksirangeneralized least squares untuk β .
Ekspektasi dan kovariansi dari taksiran parameter dengan metode generalized least squares:
1. E
( )
ˆ E⎡(
X′ −1X X)
-1 ′ −1y⎤ = ⎢⎣ ⎥⎦ β Ω Ω(
)
-1( )
1 1 X′ − X X′ −E y = Ω Ω(
1)
-1 1 X′ − X X′ − X = Ω Ω β = β .Karena itu, βˆ =
(
X′Ω−1X X)
-1 ′Ω−1y adalah penaksir yang unbiased untuk β .2. Matriks kovariansi untuk ˆβ ialah
(
)
-1 1 1 cov⎣ ⎦⎡ ⎤ˆ =cov⎢⎡ X′ − X X′ − y⎤⎥ ⎣ ⎦ β Ω Ω(
1)
-1 1( )
(
1)
-1 1 var X − X X − y X − X X − ′ ⎡ ′ ′ ⎤ ⎡ ′ ′ ⎤ = ⎢⎣ Ω Ω ⎥⎦ ⎢⎣ Ω Ω ⎥⎦(
1)
-1 1 2(
1)
-1 1 σ − − − − ′ ⎡ ′ ′ ⎤ ⎡ ′ ′ ⎤ = ⎢⎣ X Ω X X Ω ⎦⎥ Ω⎢⎣ X Ω X X Ω ⎥⎦(
)
-1(
)
-1 1 1 σ2 1 1 − − − − ⎡ ′ ′ ⎤ ⎡ ′ ⎤ = ⎢⎣ X Ω X X Ω ⎥⎦ Ω Ω⎢⎣ X X Ω X ⎥⎦(
)
-1 2 X 1X σ ′ − = Ω .2.10 Effects Models pada Data Panel
2.10.1 Fixed Effects Models pada Data Panel
Suatu effects dikatakan fixed effects, jika level dari faktor-faktornya dipilih tertentu berdasarkan keinginan peneliti dari populasi level yang ada, dan kesimpulan statistiknya terbatas hanya mengenai level-level tersebut. Model yang hanya mempunyai fixed effects
disebut fixed effects models. Berarti pada situasi ini akan dilihat effects dari level-level tersebut pada model.
Pada model untuk data panel, effects dari level-level antara lain berasal dari individu dan waktu. Oleh karena individu dan waktu dipilih secara fixed maka effects hanya sebatas pada individu dan waktu yang dipilih tersebut. Dengan demikian, effects dari individu dan waktu
diasumsikan sebagai fixed parameter yang akan ditaksir dan hasil taksirannya akan berupa nilai atau konstanta yang merupakan
intercept pada model. Karena itu pada fixed effects models, perbedaan karakteristik individu dan waktu diakomodasikan pada intercept
sehingga intercept-nya berubah antar individu dan antar waktu.
2.10.2 Random Effects Models pada Data Panel
Sedangkan suatu effects disebut sebagai random effects, jika level dari faktor-faktornya dipilih secara acak dari populasi level yang ada dan kesimpulan statistiknya mengenai populasi level dari faktor di mana data tersebut diasumsikan berasal. Model yang hanya
mempunyai random effects disebut random effects models. Berarti pada situasi ini akan dilihat effects dari level-level tersebut pada model.
Pada model untuk data panel, effects dari level-level antara lain berasal dari individu dan waktu. Oleh karena individu dan waktu dipilih secara random maka effects dari individu dan waktu diasumsikan suatu variabel acak dan akan dilihat variabilitas masing-masing effects. Dengan demikian, pada random effects models perbedaan
karakteristik individu dan waktu diakomodasikan pada error dari model. Mengingat ada dua komponen yang mempunyai kontribusi pada
perlu diurai menjadi error untuk individu, error untuk komponen waktu, dan error gabungan. Hal ini disebut dengan komponen error dua arah. Diasumsikan komponen error
(
0, 2)
i
μ IID σμ , komponen error
(
2)
0, t
λ IID σλ , dan komponen error
(
2)
0,
it v
v IID σ . Dengan μ adalah i komponen error untuk individu, λ adalah komponen error untuk t waktu, dan v adalah komponen error gabungan. it
2.11 Metode ANOVA
Metode ANOVA merupakan salah satu metode yang paling banyak digunakan dalam menaksir komponen variansi (variance components). Penaksir ANOVA merupakan penaksir jenis metode momen untuk model ANOVA, yang berarti menyamakan quadratic sums of squares dengan ekspektasinya kemudian menyelesaikan sistem persamaan linear yang muncul akibat menyamakan dua hal tersebut.
Selanjutnya akan dijelaskan gambaran umum dari metode ANOVA. Misalkan σ adalah vektor dari komponen variansi yang akan 2 ditaksir, kemudian s adalah vektor dari sums of squares. Kemudian untuk masing-masing sums of squares, akan diperoleh nilai ekspektasi yang merupakan fungsi linear dari komponen variansi. Misalkan E(s) adalah vektor dari fungsi linear tersebut yang didefinisikan sebagai
( )
s CE = σ2 (2.11.1)
dengan C adalah matriks nonsingular.
Kemudian berdasarkan metode penaksiran ANOVA, maka persamaan (2.11.1) menjadi
ˆ s C= σ 2
dengan ˆσ merupakan penaksir dari 2 σ . Dengan demikian, 2 persamaan tersebut dapat diubah menjadi
ˆ2 =C s-1
σ . (2.11.2)
Dapat dikatakan bahwa tiap-tiap elemen dari ˆσ adalah kombinasi 2 linear dari sums of squares di s.
Penaksir pada persamaan (2.11.2) selalu unbiased, sebagaimana yang ditunjukkan
( )
ˆ C-1( )
s C C-1E σ2 = E = σ2 =σ . 2
Untuk memberikan gambaran lebih jelas, misal diberikan random effects model ANOVA untuk data tidak lengkap (incomplete data) untuk 1,..., dan 1,..., ij i ij i y i a j n μ α ε = + + = = (2.11.3)
dengan yij observasi ke-j pada kelas ke-i, μ adalah general mean, αi adalah pengaruh pada variabel y yang diobservasi dan terdapat pada
kelas ke-i, dan εij adalah residual. Diasumsikan
(
2)
0, i IID σα α dan(
0, 2)
ij IID σε ε .Jika dibentuk ke dalam formulasi matriks maka persamaan (2.11.3) dapat dibentuk menjadi
( )
iNμ+ diag n
y=ι ι α ε+ . (2.11.4)
Dapat diperoleh bahwa ekspektasi dari y
( )
( )
N(
( )
ni)
( )
E y =E ι μ + E diag ι α +E ε( )
( )
i( )
( )
NE μ + diag n E α E ε =ι ι +( )
( )
i NE μ + diag n 0 0 =ι ι +( )
NE μ =ι Nμ =ιdan variansi dari y
( )
(
( )
)
var var i Nμ+ diag n V = y = ι ι α ε+( )
ni(
( )
ni)
( )
E diag⎛ α diag α ′⎞ E εε′ = ⎜ ⎟+ ⎝ ι ι ⎠( )
ni(
)
( )
ni( )
diag E αα′ diag ′ E εε′ = ι ι +( )
2( )
2 i i n a n N diag σαI diag ′ σεI = ι ι +( )
2 2 i n N diag α ε σ J σ I = +(
2 2)
i i
n n
diag σαJ σεI
= +
sehingga diperoleh bahwa
(
(
2 2)
)
i i
N n n
IID μ diag σα σε
y ι , V= J + I .(2.11.5)
Didefinisikan Between dan Within Sums of Squares yang merupakan dasar dari analysis of variance untuk persamaan (2.11.3) adalah
(
)
2 2 2 . .. . .. 1 SSA a i i i i i i n y y n y Ny = =∑
− =∑
− (2.11.6)(
)
2 2 2 . . 1 1 SSE i n a ij i i j ij i i i i j y y y n y = = =∑∑
− =∑ ∑
−∑
(2.11.7) dengan N =∑
ini .Persamaan (2.11.6) dan (2.11.7) jika ditransformasi ke dalam bentuk matriks akan menjadi
2 2 . .. SSA=
∑
in yi i −Ny . i .. i n N iy ′ y ′ =∑
ι y− ι y( )
diag y J y y J y i n N ′ ′ = −( )
untuk diag y A y A J J i 1 1 n N ′ = = − (2.11.8) dan 2 2 . SSE=∑ ∑
i jyij −∑
in yi i . i i n iy ′ ′ =y y−∑
ι y( )
ni diag y I y y′N ′ J y = −( )
untuk diag ni y A y′ 2 A2 IN J = = − . (2.11.9)Selanjutnya akan diperoleh ekspektasi dari masing-masing sum of squares dalam formulasi matriks berdasarkan teorema 2.8.3.1 dan pernyataan (2.11.5) adalah:
(
SSA)
(
)
E =E y A y′ 1(
1)
( )
1( )
tr E ′ E = AV + y A y( )
(
)
(
2 2)
i i i n N n n tr⎡ diag diag σα σε ⎤ = ⎣ J −J ⋅ J + I ⎦( )
(
i)
N diag n N N μ ′ μ + ι J −J ι(
)
(
)
(
( )
)
2 i i i n n N n tr diag tr diag α σ ⎡ ⎤ = ⎣ J J − J J ⎦( )
(
)
( )
(
)
2 2 2 2 i i n N i i n N tr diag tr n N ε σ μ ⎛ ⎞ + − + ⎜ − ⎟ ⎝∑
⎠ J J 2 2 2 i i i 2 i i i i i n n n N n N n N α ε σ ⎛ ⎞ σ ⎛ ⎞ = ⎜⎜ − ⎟⎟+ ⎜ − ⎟ ⎝ ⎠ ⎝ ⎠∑
∑
∑
(
)
2 2 2 1 i in N a N σα σε ⎛ ⎞ =⎜⎜ − ⎟⎟ + − ⎝ ⎠∑
. (2.11.10) dan(
SSE)
(
)
E =E y A y′ 2(
2)
( )
2( )
tr E ′ E = A V + y A y( )
(
)
(
2 2)
i i i n n n tr⎡ diag diag σα σε ⎤ = ⎣ IN − J ⋅ J + I ⎦( )
(
i)
N diag n N μ ′ μ + ι IN − J ι( )
(
)
(
(
)
)
2 i i i N n n n tr diag tr diag α σ ⎡ ⎤ = ⎣ I ⋅ J − J J ⎦( )
(
)
(
(
)
)
2 i i i N n n n tr diag tr diag ε σ ⎡ ⎤ + ⎣ I ⋅ I − J I ⎦ 2 2 i i i n N n μ ⎛ ⎞ + ⎜ − ⎟ ⎝∑
⎠(
)
2 2 2 i i i 2 i i n n N a N n α ε σ ⎛ ⎞ σ = ⎜⎜ − ⎟⎟+ − ⎝ ⎠∑
∑
(
)
2 2 N N 2 N a N α ε σ ⎛ ⎞ σ = ⎜ − ⎟+ − ⎝ ⎠(
)
2 N a ε σ = − . (2.11.11)Berdasarkan prinsip metode momen pada penaksiran ANOVA maka dilakukan penyamaan antara persamaan (2.11.8) dengan persamaan (2.11.10) dan persamaan (2.11.9) dengan persamaan (2.11.11). Kemudian σε2 dan σα2 pada persamaan (2.11.10) dan (2.11.11) disubstitusi dengan σˆε2 dan σˆα2, sehingga diperoleh
(
)
(
)
2 2 2 2 SSA ˆ 1 ˆ SSE ˆ i in N a N N a α ε ε σ σ σ ⎛ ⎞ =⎜⎜ − ⎟⎟ + − ⎝ ⎠ = −∑
. (2.11.12)(
)
2 SSE ˆ N - a ε σ = dan 2(
) ( )
2 SSA SSE ˆ 1 -i i a N a n N N α σ = − − ⎛ ⎞ − ⎜ ⎟ ⎜ ⎟ ⎝ ⎠∑
(2.11.13)Jika disesuaikan dengan bentuk umum yang sebelumnya diperoleh dari metode ANOVA, maka
C ˆσ = s 2
(
)
2 2 2 0 SSE ˆ SSA 1 i i ˆ N a n a N N ε α σ σ ⎡ − ⎤ ⎢ ⎛ ⎞⎥ ⎡ ⎤ ⎡ ⎤ = ⎢ − ⎜ − ⎟⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ ⎢ ⎜ ⎟⎥ ⎝ ⎠ ⎣ ⎦∑
(2.11.14)sehingga dengan metode ANOVA diperoleh ˆ2 =C s-1 σ ( ) ( ) ( ) 2 1 2 1 1 2 0 SSE ˆ SSA ˆ i i N a a N a n N N ε α σ σ − − − − ⎛ ⎞ ⎜ − ⎟ ⎜ ⎟ ⎝ ⎠ ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎡ ⎤ = ⎢ ⎥ ⎢ ⎥ ∑ ⎢ ⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ (2.11.15)