III. KERANGKA PEMIKIRAN
3.1 Kerangka Pemikiran Teoritis
3.1.5 Teknik Estimasi Menggunakan Regresi Data Panel
Analisis Regresi Data Panel merupakan gabungan antara data cross section dengan data time series. Data cross section berupa data yang dikumpulkan pada waktu yang sama tetapi dengan pengamatan yang berbeda. Sedangkan data time series berupa data yang dikumpulkan dengan menggunakan suatu pengamatan pada beberapa periode. Menurut Gujarati (2003), metode data panel adalah metode yang dapat digunakan untuk melakukan analisis empirik yang tidak mungkin dilakukan jika hanya menggunakan data cross-section maupun hanya menggunakan data time-series.
Sebagai contoh, untuk membuat model probabilitas sebuah perusahaan dalam sebuah industri dapat digunakan data section. Namun data cross-section tidak mampu memperhitungkan terjadinya peningkatan pendapatan
perusahaan yang terjadi akibat perubahan teknologi seiring dengan berjalannya waktu. Dengan menggunakan data panel, komponen time-series dari data dapat dimasukkan untuk menggabungkan efek perubahan teknologi pada probabilitas perusahaan dan menghilangkan masalah yang timbul pada variabel-variabelnya. Proses mengkombinasikan data cross-section dan data time-series menjadi data panel disebut pooling (Pindyck dan Rubienfield, 1998).
Seperti telah diketahui sebelumnya, bahwa data panel adalah pemodelan dengan menggunakan data cross-section dan data time-series. Oleh karena itu jumlah pengamatan menjadi sangat banyak. Menurut Nachrowi (2006), hal ini bisa merupakan keuntungan (data banyak) tetapi model yang menggunakan data ini menjadi lebih kompleks (parameternya banyak).
Model regresi untuk data cross-section dan time-series masing-masing adalah sebagai berikut :
Model dengan data cross-section Yi = α + βXi + εi ; i = 1,2,..., N N : banyaknya data cross-section Model dengan data time-series
Yt = α + βXt + εt ; t = 1,2,..., T T : banyaknya data time-series
Mengingat data panel merupakan gabungan dari data cross-section dan data time-series, maka model data panel yang dituliskan adalah sebagai berikut :
Yit = α + βXit + εit ; i = 1, 2, ..., N; dan t = 1, 2, ... T dimana :
N = banyaknya observasi T = banyaknya waktu N x T = banyaknya data panel
Ada beberapa keuntungan menggunakan data panel. Menurut Baltagi dalam Gujarati (2003), keuntungan menggunakan data panel yaitu :
1. Teknik estimasi model menggunakan data panel dapat memasukkan hetergenitas secara eksplisit kedalam perhitungan dengan memperhitungkan variabel-variabel individual yang spesifik.
2. Dengan mengkombinasikan observasi-observasi time-series dan cross-section, metode data pabel mampu memberikan observasi yang lebih informatif, variabilitas yang lebih banyak, mengurangi multikolinear, derajat bebas yang lebih banyak, dan juga lebih efisien.
3. Dalam mempelajari perubahan yang dinamis seperti jumlah pengangguran, pertukaran tenaga kerja dan mobilitas pekerja, maka lebih baik menggunakan data panel.
4. Data panel dapat mendeteksi dan mengukur dengan lebih baik berbagai efek yang tidak dapat diobservasi dengan hanya menggunakan data cross-section maupun data time-series.
5. Penggunaan data panel dapat mempermudah dalam mempelajari model behavioral yang rumit, seperti fenomena skala ekonomis dan perubahan teknologi.
6. Pada jumlah data yang mencapai beberapa ribu unit, data panel dapat meminimalisasi bias yang mungkin dihasilkan jika mengubah data individu menjadi agregat.
Untuk mengestimasi parameter model dengan data panel, teknik yang dilakukan adalah :
1. Metode Pooled OLS (Ordinary Least Square)
Teknik ini tidak ubahnya membuat regresi dengan data cross-section dan data time-series pada umumnya. Akan tetapi, untuk data panel, sebelum membuat regresi harus dilakukan penggabungan data cross-section dan data time-series (pooled data). Kemudian data gabungan ini yang akan digunakan untuk mengestimasi model dengan metode OLS.
2. Metode Efek Tetap (Fixed Effect)
Adanya variabel-variabel yang tidak semuanya masuk dalam persamaan model memungkinkan adanya intercept yang tidak konstan. Atau dengan kata lain, intercept ini mungkin berubah untuk setiap individu dan waktu. Pemikiran inilah yang menjadi dasar pemikiran pembentukan model tersebut. Untuk selanjutnya, dalam tulisan ini Metode Efek Tetap disingkat MET.
3. Metode Efek Random (Random Effect)
Bila pada Model Efek Tetap, perbedaan antar individu dan atau waktu dicerminkan lewat intercept, maka pada Model Efek Random, perbedaan tersebut diakomodasi dalam error. Teknik ini juga memperhitungkan bahwa error mungkin berkorelasi sepanjang time-series dan cross-section. Untuk selanjutnya Metode Efek Random disingkat MER.
3.1.5.1 Metode Pooled OLS
Pada metode pooled OLS, data cross-section dan data time-series digabungkan yang kemudian dilakukan estimasi model dengan menggunakan metode OLS. Persamaan regresi untuk model pooled OLS sebagai berikut (Pindyck dan Rubienfield, 1998) :
Yit = α + β1Xit,1 + β2Xit,2 + ... + βkXit,k + εit
untuk i = 1, 2, ..., N; dan t = 1, 2, ... T
Xit = 1 untuk i = 1, 2, ..., N; dan t = 1, 2, ... T dimana :
i = unit cross-section t = unit time-series
Yit = peubah respon pada unit cross-section dan waktu ke-t Xit = peubah respon pada unit time-series dan waktu ke-t β1 = intersep
εit = peubah galat pada unit cross-section dan waktu ke-t
Pada penggunaan metode pooled OLS, α dan β diasumsikan sama (konstan) untuk setiap data cross-section dan data time-series. Akan tetapi, penetapan asumsi ini menjadi tidak realistis jika contoh kita ingin mengamati pengaruh iklan terhadap omset pada 10 perusaahan. Tidaklah realistis apabila kita membuat model sebuah perusahaan yang bergerak dalam bidang makanan memiliki intersep yang sama dengan perusahaan yang bergerak dalam bidang jasa. Atau juga tidaklah realistis jika menggunakan intersep yang sama untuk perusahaan skala kecil, menengah, dan besar. Permasalahan inilah yang kemudian akan dipecahkan dengan menggunakan Metode Efek Tetap (MET) dan juga Metode Efek Random (MER).
3.1.5.2 Metode Fixed Effect
Seperti telah dijelaskan di atas, bahwa asumsi pembuatan model yang menghasilkan α konstan untuk setiap individu (i) dan waktu (t) kurang realistik. Untuk itu, dalam MET ditambahkan variabel dummy sebagai variabel bebas, tetapi koefisien lainnya tetap sama untuk setiap individu yang diobservasi.
Secara matematis, model MET dinyatakan sebagai berikut : Yit = αi + β1Xit + γ2W2t + ... + γNWNt + δTZiT + ... + δTZiT + εiT
dimana :
Yit = peubah respon pada unit cross-section dan waktu ke-t Xit = peubah bebas ke-k pada unit cross-section dan waktu ke-t Wit dan Zit variabel dummy yang didefenisikan sebagai berikut : Wit = 1 : untuk unit cross-section i; i = 1, 2, ... , N
= 0 : lainnya
Zit = 1 : untuk periode t; t = 1, 2, ... , T = 0 : lainnya
Dari model diatas, terlihat bahwa sesungguhnya MET adalah sama dengan regresi yang menggunakan dummy variable sebagai variabel bebas, sehingga dapat diestimasi dengan Ordinary Least Square (OLS). Dengan diestimasinya tersebut menggunakan OLS, maka akan memperoleh estimator yang tidak bias dan konsisten.
Model yang di atas terdiri dari banyak koefisien. Apabila kita mempunyai N individu dan T waktu, maka kita akan mempunyai parameter sebanyak :
(N-1) buah parameter γ (T-1) buah parameter δ Sebuah parameter α Sebuah parameter β
Bila persamaan regresi MET dijabarkan satu per satu, maka akan diperoleh berbagai persamaan, yaitu :
i = 1; t=1; Y11 = α + βX11 + ε11
t=2; Y12 = (α+δ2) + βX12 + ε12
:
i = 2; t=1; Y21 = (α+γ2) + βX21 + ε21 t=2; Y22 = (α+ γ2+δ2) + βX22 + ε22 : t=T; Y2T = (α+ γ2+δT) + βX2T + ε2T : : : i = N; t=1; YN1 = (α+γN) + βXN1 + εN1 t=2; YN2 = (α+ γN+δ2) + βXN2 + εN2 : t=T; YNT = (α+ γN+δT) + βXNT + εNT
Untuk mengetahui apakah α konstan pada setiap i dan t ataukah berubah-ubah, maka dilakukan uji sebagai berikut :
F{(RSSOLS – RSSMET) / RSSMET} . {(NT-N-T) / (N + T -2)}
Nilai tersebut dibandingkan dengan Tabel F, jika nilai hasil penghitungan lebih besar dibandingkan Tabel F, maka kita dapat menolak hipotesis, yang berarti α tidak konstan pada setiap i dan t, atau dengan kata lain MET lebih baik. (Nacrowi,2006)
Menurut Pindyck dan Rubienfield (1998), terdapat beberapa masalah yang berhubungan dengan penggunaan MET. Permasalahan pertama adalah bahwa penggunaan variabel dummy tidak dapat mengidentifikasi secara langsung penyebab perubahan garis regresi pada periode dan individu. Dan, permasalahan kedua yakni, teknik variabel dummy akan mengurangi jumlah derajat bebas.
3.1.5.3 Metode Random Effect
Pada Metode Efek Tetap, perbedaan karakteristik individu dan waktu diakomodasikan pada intercept, sehingga intercepnya berubah antar individu dan antar waktu. Sedang pada Metode Efek Random (MER) perbedaan karakteristik individu dan waktu diakomodasikan pada error dari model.
Error dapat dipengaruhi oleh individu dan waktu. Oleh karena itu, random error pada MER juga perlu diurai menjadi error untuk komponen individu, error komponen waktu, dan error gabungan. Dengan demikian, persamaan MER diformulasikan sebagai berikut :
dimana :
ui = komponen error cross-setion vt = komponen errortime-series wit = komponen error gabungan
Asumsi yang digunakan untuk komponen error tersebut adalah : ui ~ N (0, ζu2);
vt ~ N (0, ζv2); wit ~ N (0, ζw2)
Berdasarkan persamaan di atas, maka dapat dinyatakan bahwa MER menganggap efek rata-rata dari data cross-section dan data time-series dipresentasikan dalam intercept. Sedangkan deviasi efek secara random untuk data time-series dipresentasikan dalam vi dan deviasi untuk data cross-section dinyatakan dalam ui. Seperti telah diketahui sebelumnya bahwa : εit = ui + vt + wit. Dengan demikian varians dari error tersebut dapat dituliskan dengan :
Var (εit) = ζit2 + ζv2 + ζw2
Hal ini tentunya berbeda dengan model OLS yang diterapkan pada data panel (Pooled OLS) sebagaimana telah dijelaskan diatas yang mempunyai varian sebesar :
Var (εit) = ζw2
Dengan demikian, Metode Efek Random dapat diestimasi dengan OLS bila ζit2 = ζv2 = 0. Kalau tidak demikian, MER perlu diestimasi dengan metode lain. Adapun metode estimasi yang digunakan adalah Generalized Least Square (GLS).
Menurut Pindyck dan Rubienfield (1998), penggunaan data panel dapat memisahkan dampak ekonomi yang tidak dapat dibedakan apabila hanya menggunakan data cross-section maupun dengan time-series saja. Hal lain juga, penggunaan data panel dapat menambah poin data yang akan berpengaruh terhadap derajat bebas dan dapat memecahkan permasalahan penghilangan variabel dengan informasi yang diperoleh dari hubungan antara cross-section dan time-series. Menurut Hsiao (1986) keuntungan data panel adalah (1) dapat mengidentifikasi model ekonomi dan membedakan antara hipotesis ekonomi, (2) dapat mengurangi dan menghilangkan bias dugaan, dan (3) dapat mengurangi masalah multikolinearitas.