• Tidak ada hasil yang ditemukan

3.2. Metode Analisis

3.2.4. Analisis Data Panel Statis

Data panel adalah data yang memiliki dimensi ruang (individu) dan waktu, yang merupakan gabungan antara data silang (cross section) dengan data runtut waktu (time series). Jika setiap unit cross section memiliki jumlah observasi time series yang sama maka disebut sebagai balanced panel. Sebaliknya jika jumlah observasi berbeda untuk setiap unit cross section maka disebut unbalanced panel.

Keunggulan dari penggunaan data panel dalam analisis ekonometrik antara lain: (i) mampu mengontrol heterogenitas individu; (ii) memberikan informasi yang lebih banyak dan beragam, meminimalkan masalah kolinieritas (collinearity), meningkatkan jumlah derajat bebas dan lebih efisien; (iii) data panel umumnya lebih baik bila digunakan dalam studi dynamics of adjustment; (iv) data panel lebih baik dalam mengukur dan mengidentifikasi serta mengukur efek yang tidak dapat dideteksi apabila menggunakan data crosssection atau time series murni; dan (v) data panel dapat digunakan untuk mengonstruksi dan menguji model perilaku yang lebih kompleks dibandingkan data cross section

atau time series murni.

Meskipun demikian, analisis data panel juga memiliki beberapa kelemahan dan keterbatasan dalam penggunaannya khususnya apabila data panel dikumpulkan atau diperoleh dengan metode survei. Permasalahan tersebut antara lain: (i) relatif besarnya data panel karena melibatkan komponen cross section dan

time series menimbulkan masalah disain survei panel, pengumpulan dan manajemen data (masalah yang umumnya dihadapi di antaranya: coverage,

nonresponse, kemampuan daya ingat responden (recall), frekuensi, dan waktu wawancara; (ii) distorsi kesalahan pengamatan (measurement error) yang umumnya terjadi karena kegagalan respon (contoh: pertanyaan yang tidak jelas, ketidaktepatan informasi, dan lain-lain); (iii) masalah selektivitas, yakni:

pada survey lanjutan); dan (iv) cross section dependence (contoh: apabila macro panel data dengan unit analisis negara atau wilayah dengan deret waktu yang panjang mengabaikan cross-country dependence maka dapat mengakibatkan kesimpulan-kesimpulan yang tidak tepat (miss leading inference).

Data panel dapat didefinisikan sebagai observasi berulang pada setiap unit

cross section yang sama, yang memiliki karakteristik di mana N > 1 dan T > 1. Misalkan yit merupakan nilai varabel dependen untuk unit cross section ke-i pada waktu ke-t dengan i = 1, 2,…, N dan t = 1, 2,…,T. Dan misalkan terdapat K

variabel penjelas yang masing-masing diberi indeks j = 1, 2,…,K serta dinotasikan sebagai , yang menyatakan nilai variabel penjelas ke-j untuk unit ke-i pada waktu ke-t. Cara yang sering digunakan untuk mengorganisir data panel adalah dengan menuliskannya ke dalam bentuk matriks sebagai berikut:

; ; = ...(3.6)

dengan menyatakan gangguan acak untuk unit ke-i pada waktu ke-t.

Selanjutnya data tersebut disederhanakan dalam bentuk stack sebagai berikut:

; ; ...(3.7)

dengan y adalah matriks berukuran NTx1, X adalah matriks berukuran NTxK, dan

ε adalah matriks berukuran NTx1. Model standar data panel linier dapat diekspresikan sebagai

y = X 'β + ε ...(3.8) dengan β adalah matriks berukuran NT x 1 yang diekspresikan sebagai

...(3.9)

Ada beberapa metode yang sering digunakan untuk mengestimasi parameter model data panel statis. Metode sederhana yang sering digunakan adalah pooled estimator atau dikenal sebagai metode least square yang umumnya digunakan pada model cross section dan time series murni. Sebagaimana dibahas

sebelumnya bahwa data panel memiliki jumlah observasi lebih banyak dibandingkan data cross section dan time series murni. Akibatnya, ketika data digabungkan menjadi pool data, regresi yang dihasilkan cenderung lebih baik dibandingkan regresi yang menggunakan data cross section dan time series murni. Akan tetapi, dengan mengabungkan data, maka variasi atau perbedaan baik antara individu dan waktu tidak dapat terlihat. Hal ini tentunya kurang sesuai dengan tujuan dari digunakannya data panel. Lebih jauh lagi, dalam beberapa kasus, penduga yang dihasilkan melalui least square dapat menjadi bias akibat kesalahan spesifikasi data.

Untuk mengatasi permasalahan tersebut, ada dua metode yang biasanya digunakan dalam pemodelan data panel, yakni metode efek tetap (fixed effects model) dan metode efek random (random effects model). Persamaan berikut:

...(3.10) dengan gangguan acak diasumsikan mengikuti one-way error component model

sebagai berikut:

...(3.11) dan diasumsikan bahwa uit merupakan gangguan acak yang tidak berkorelasi dengan Xit . Sedangkan αi disebut sebagai efek individual (time invariantperson specific effect). Beberapa aplikasi empiris data panel umumnya melibatkansatu di antara asumsi mengenai efek individual.

Pertama, bila αi diperlakukan sebagai parameter tetap, namun bervariasi antar i = 1,2,…, N , maka model ini disebut sebagai fixed effects model (FEM). Model efek tetap umumnya digunakan ketika terdapat korelasi antara intersep individual dan variabel independen r. Secara umum model ini dapat diekspresikan sebagai

...(3.12) dengan asumsi bahwa uit ~ iid (0, ). Penduga dari model ini mampu menjelaskan perbedaan atau variasi antar individu (differences within individual), karena model ini memungkinkan adanya perbedaan intersep α pada setiap i. Penduga dari model ini ditentukan sebagaimana penduga least square dalam regresi namun dalam bentuk deviasi rata-rata individual. Menurut Verbeek (2000),

dugaan untuk paremeter β dengan menggunakan FEM dapat diformulasikan sebagai

...(3.13) Sedangkan estimasi untuk intersep α dituliskan sebagai

...(3.14) Matriks kovarian untuk fixed effect estimator , dengan uit ~ iid (0, ) diberikan oleh:

...(3.15) dengan

……….…...…(3.16) Pada dasarnya, FEM lebih menekankan pada perbedaan di antara individu, yakni menjelaskan bagaimana berbeda dari , dan tidak menjelaskan kenapa berbeda dari ). Di sisi lain, asumsi parametrik mengenai β, menekankan bahwa perubahan yang terjadi dalam X memiliki pengaruh yang sama, apakah perubahan dari satu periode ke periode lainnya atau perubahan dari satu individu ke individu lainnya.

Kedua, bila diperlakukan sebagai parameter random, maka model disebut sebagai random effects model (REM). Dalam REM, perbedaan karakeristik individu diakomodasi oleh error dalam model. Secara umum model ini dapat diekspresikan sebagai:

...(3.17) dengan dan memiliki rata-rata nol. Di sini, merepresentasikan gangguan individu (individual disturbance) yang tetap sepanjang waktu. Beberapa asumsi yang melekat dalam REM antara lain:

...(3.18) ...(3.19) ...(3.20) ...(3.21) ...(3.22) ... (3.23) ...(3.24)

Untuk menduga REM umumnya digunakan metode generalized least square (GLS). Misalkan kombinasi error pada persamaan (3.17) dituliskan

menjadi , dengan

...(3.25) ...(3.26)

...(3.27) ...(3.28) Apabila gangguan sejumlah T untuk individu i dikumpulkan dalam bentuk vektor

)’ maka dapat dituliskan bahwa

...(3.29) dengan

...(3.30)

Untuk keseluruhan observasi panel, matriks kovarian error

dapat diturunkan sebagai

...(3.31)

dengan menyatakan matriks identitas berdimensi N dan merepresentasikan

Kronecker product. Misalkan Y pada persamaan (3.18) direpresentasikan sebagai vektor stack dari yang dibentuk dengan pola yang sama dengan w (dengan struktur yang sama untuk X). Selanjutnya keseluruhan sistem yang dituliskan sebagai

Y = Xβ + w ...(3.32) dapat diestimasi dengan menggunaan metode GLS. Secara umum pendugaan GL untuk persamaan regresi (3.32) memerlukan transformasi untuk menghilangkan struktur yang tidak baku dari matriks kovarian . Kemudian dengan mendefinisikan matriks penimbang dan mengalikannya ke kedua ruas pada persamaan (3.42) diperoleh hasil transformasi sebagai berikut:

...(3.33) atau ...(3.34) sekarang = PE (ww’)P = PVP =

Sehingga, penduga GLS pada persamaan regresi (3.41) dapat dituliskan sebagai

...…...(3.35)