EKONOMETRIKA
PANEL DATA
Setyo Tri Wahyudi, SE., M.Ec., Ph.D
Jurusan Ilmu Ekonomi
Fakultas Ekonomi dan Bisnis
Universitas Brawijaya
PENDAHULUAN
Econometrics: gabungan Economics dan Metrics atau
economic measurement (mengukur variabel-variabel ekonomi) (Gujarati, 2004)
Beberapa definisi ttg Econometrics adalah sebagai
berikut:
The quantitative analysis of actual economic
phenomena based on the concurrent development of theory and observation, related by appropriate methods of inference (Samuelson, et al., 1954)
The social science in which the tools of economic
theory, mathematics, and statistical inference are applied to the analysis of economic phenomena (Goldberger, 1964)
Concern with the empirical determination of
economic laws (Theil, 1971)
Istilah ekonometrika diperkenalkan tahun 1926 oleh
Ragner Frisch (pakar ekonomi dan statistik Norwegia)
3
Teori Ekonomi Matematika Ekonomi Statistika Ekonomi
Menjelaskan fenomena ekonomi
secara kuantitatif
Menyatakan teori ekonomi dalam bentuk
matematik (hubungan antar variabel)
Proses pengumpulan data, pengolahan, dan
penyajian data (grafik dan tabel)
Contoh:
Jika P↓ maka D↑ (T. mikro) hubungan (-) P dan D
Berapa perubahan D (?)
1. Deskriptif (S-D curves, market equilibrium, elasticity, etc) 2. Inferensi (t-test,
F-test, R2) 1. Linear equation
(slope, etc) 2. Differential
(elasticity, utility, etc)
Econometrics
Tools/alat: SPSS, E-Views, SAS, STATA, SHAZAM, R, etc.
Gabungan ketiganya untuk analisis:
- Koefisien hubungan antar variabel - Interpretasi hasil secara ekonomi
Tujuan Ekonometrika
1.
Verifikasi
membuktikan atau menguji validitas
teori-teori ekonomi
2.
Estimasi (penaksiran)
menghitung nilai estimasi koefisien
hubungan antar variabel ekonomi
3.
Forecasting (peramalan)
meramal suatu variabel ekonomi
tertentu di masa yang akan datang
Metode Ekonometrika
5
1. Economic theory
2. Mathematical model of theory 3. Econometric model of theory
4. Data
5. Estimation of econometric model
6. Hypothesis testing
7. Forecasting or prediction
Contoh: MPC
1. Statement of theory or hypothesis
Teori Keynesian: MPC (marginal propensity to consume)
Perubahan tingkat konsumsi akibat perubahan
pendapatan 1 unit (misal 1 dollar) adalah lebih dari 0 tetapi kurang dari 1 (0 < MPC < 1)
6
2. Specification of the mathematical model of consumption
Fungsi konsumsi Keynesian: Y = β1 + β2X; 0 < β2 < 1 Y : pengeluaran konsumsi X : income
β1 dan β2 : parameter model β1 : intercept
3. Specification of the econometric model of consumption
Spesifikasi matematis model konsumsi (Y = β1 + β2X)
dimodifikasi menjadi model ekonometrik: Y = β1 + β2X + u; u : error term
4. Obtaining Data
Estimasi model ekonometrika memperoleh
nilai β
1dan β
2 diperlukan DATA
5. Estimation of the Econometric Model
Estimasi parameter fungsi konsumsi (β1 dan β2) teknik statistik ANALISIS REGRESI
Selama tahun 1982-1996, koefisien slope (MPC) sekitar 0.70 interpretasi:
Selama tahun 1982-1996, kenaikan pendapatan riil 1
dollar meningkatkan pengeluaran konsumsi riil rata-rata 70 sen
Hubungan konsumsi dan pendapatan kurang tepat
(inexact) tidak semua titik secara tepat berada di
garis regresi 9
6. Hypothesis Testing
Asumsi: model ekonometrika cukup baik menyatakan kondisi riil
Teori Keynesian: 0 < MPC < 1 Data empiris: MPC = 0.70
Uji hipotesis: apakah 0.70 secara statistik kurang dari satu?
10
7. Forecasting or Prediction
Diketahui:
GDP tahun 1997 = 7269.8 billion dollars
Maka: 1997 = -184.0779 + 0.7064(7269.8) = 4951.3167
Forecast consumption expenditure = 4951.3 billion dollars
Actual consumption expenditure = 4913.5 billion dollars
Model estimasi fungsi konsumsi overpredicted terhadap nilai aktual sebesar 37.82 billion dollars forecast error = 37.82 billion dollars (sekitar 0.77% dari actual consumption
8. Use of the model for control or policy purposes
Misal fungsi konsumsi: =-184.0779 + 0.7064Xi
Misal pemerintah percaya bahwa pengeluaran
konsumsi 4900 billion dollar akan mempertahankan tingkat pengangguran sebesar 4.2%.
Berapa tingkat pendapatan untuk mencapai target tersebut?
4900 = 184.0779 + 0.7064X X = 7197
Dengan tingkat pendapatan 7197 billion dollar dan MPC 0.7 akan menghasilkan pengeluaran konsumsi 4900 billion dollars
Tahapan Analisis Ekonometrika
12
Identifikasi dan perumusan masalah
Kerangka Pemikiran
Spesifikasi Model
Pengumpulan Data
Estimasi Parameter
Evaluasi/Validasi Model
Aplikasi Model untuk Rumusan Kebijakan
Teori ekonomi dan konsep2 terkait
Kajian studi-studi terdahulu
Pemilihan variabel terkait Hipotesis (tanda dan
besaran) Data Primer Data
Sekunder
Cross-Section Time Series
Panel
OLS, MLE, ILS, 2SLS, etc BLUE
Krit. Ekonomi (besaran & tanda)
Krit. Statistik (signifikansi, koef det)
Metodologi Ekonometrika
Berdasarkan Jenis Data
13
DATA
Cross Section Time Series PANEL
Univariate Multivariate
Correlation Regression Multivariate analysis
Regression AR, MA ARMA ARIMA
ARCH, GARCH
Correlation Regression Granger Causality VAR
ECM, VECM
Pooled
Tipologi data
Data Nominal:
bersifat kualitatif, tidak memiliki
arti urutan. Misal: Laki = 1; Perempuan = 2
Data Ordinal:
bersifat kualitatif, memiliki arti
urutan. Misal: Juara 1; Juara 2; Juara 3
Data Interval:
bersifat kuantitatif/numeris,
tidak memiliki nilai nol absolut (sehingga rasio
antar data tidak memiliki arti). Misal: Suhu 10
C dan 20 C, bukan berarti 20 C tdk sama
dengan 2 kali 10 C
Data Rasio:
bersifat kuantitatif/numeris,
memiliki nilai nol absolut. Misal: Tinggi badan
Cara Pengambilan Data
Nilai variabel dari suatu
individu pada suatu
rentang periode waktu
Periode waktu bisa
berupa periode harian,
mingguan, bulanan,
triwulanan, tahunan dsb
Contoh: data konsumsi
dan PDB Indonesia
periode tahun 2000-2010
15
TAHUN CRIIL PDBRIIL
2000 856,798 1,265,890 2001 886,736 1,277,342 2002 920,750 1,316,776 2003 956,593 1,351,205 2004 1,004,109 1,447,182 2005 1,043,805 1,521,194 2006 1,076,928 1,585,488 2007 1,130,847 1,689,149 2008 1,191,191 1,836,356 2009 1,249,011 1,875,616 2010 1,306,801 2,020,875
DATA KONSUMSI DAN PDB RIIL INDONESIA (Juta Rp) (2000=100)
16
fungsi konsumsi: = 171287.1 + 0.57Xi Y : CRIIL (konsumsi riil)
X : PDBRIIL (PDB riil)
Dependent Variable: CRIIL Method: Least Squares Sample: 2000 2010
Included observations: 11
Variable Coefficient Std. Error t-Statistic Prob. C 171287.1 32101.87 5.335737 0.0005
PDBRIIL 0.566671 0.020287 27.93258 0.0000
R-squared 0.988596 Mean dependent var 1056688. Adjusted R-squared0.987329 S.D. dependent var 149603.9 S.E. of regression 16839.97 Akaike info criterion 22.46386 Sum squared resid 2.55E+09 Schwarz criterion 22.53621
Log likelihood -121.5512 Hannan-Quinn criter. 22.41826 F-statistic 780.2293 Durbin-Watson stat 1.347252
Prob(F-statistic) 0.000000
TAHUN CRIIL PDBRIIL
2000 856,798 1,265,890 2001 886,736 1,277,342 2002 920,750 1,316,776 2003 956,593 1,351,205 2004 1,004,109 1,447,182 2005 1,043,805 1,521,194 2006 1,076,928 1,585,488 2007 1,130,847 1,689,149 2008 1,191,191 1,836,356 2009 1,249,011 1,875,616 2010 1,306,801 2,020,875
DATA KONSUMSI DAN PDB RIIL INDONESIA
Data Cross Section
Nilai variabel dari
beberapa individu pada
satu periode waktu yang
sama
Individu bisa berupa
negara, provinsi,
perusahaan, perorangan,
dsb
Contoh: data konsumsi
dan PDRB seluruh
provinsi di Indonesia
tahun 2011
17
TAHUN PROV CNOM PDRBNOM
2011 NAD 35,305,263 85,537,966 2011 Sumut 186,029,226 314,156,937 2011 Sumbar 53,011,431 98,917,269 2011 Riau 128,118,434 413,350,123 2011 Jambi 37,891,889 63,268,138 2011 Sumsel 115,478,933 181,776,073 2011 Bengkulu 12,780,991 21,150,290 2011 Lampung 65,624,263 128,408,895 2011 Babel 15,598,162 30,254,777 2011 Kepri 61,555,344 80,242,794 2011 DKI 542,133,712 982,540,044 2011 Jabar 510,388,750 861,006,348 2011 Jateng 320,409,013 498,614,636 2011 DIY 26,319,645 51,782,092 2011 Jatim 597,413,773 884,143,575 2011 Banten 85,637,614 192,218,910 2011 Bali 44,398,065 73,478,162 2011 NTB 22,768,353 48,729,107 2011 NTT 22,450,911 31,204,406 2011 Kalbar 35,357,043 66,780,222 2011 Kalteng 21,935,482 49,072,507 2011 Kalsel 31,772,043 68,234,881 2011 Kaltim 49,503,200 390,638,617 2011 Sulut 18,329,055 41,505,118 2011 Sulteng 26,429,347 44,317,855 2011 Sulsel 66,264,062 137,389,879 2011 Sultra 16,565,955 32,032,499 2011 Gorontalo 6,334,898 9,153,669 2011 Sulbar 8,460,490 12,895,358 2011 Maluku 6,647,679 9,953,798 2011 Malut 4,096,729 6,056,974 2011 Papua Barat 13,139,228 36,170,456 2011 Papua 41,897,884 77,778,807
18
fungsi konsumsi: =-7804272 + 0.58Xi Y : CNOM (konsumsi nominal)
X : PDRBNOM (PDRB nominal)
TAHUN PROV CNOM PDRBNOM
2011 NAD 35,305,263 85,537,966 2011 Sumut 186,029,226 314,156,937 2011 Sumbar 53,011,431 98,917,269 2011 Riau 128,118,434 413,350,123 2011 Jambi 37,891,889 63,268,138 2011 Sumsel 115,478,933 181,776,073 2011 Bengkulu 12,780,991 21,150,290 2011 Lampung 65,624,263 128,408,895 2011 Babel 15,598,162 30,254,777 2011 Kepri 61,555,344 80,242,794 2011 DKI 542,133,712 982,540,044 2011 Jabar 510,388,750 861,006,348 2011 Jateng 320,409,013 498,614,636 2011 DIY 26,319,645 51,782,092 2011 Jatim 597,413,773 884,143,575 2011 Banten 85,637,614 192,218,910 2011 Bali 44,398,065 73,478,162 2011 NTB 22,768,353 48,729,107 2011 NTT 22,450,911 31,204,406 2011 Kalbar 35,357,043 66,780,222 2011 Kalteng 21,935,482 49,072,507 2011 Kalsel 31,772,043 68,234,881 2011 Kaltim 49,503,200 390,638,617 2011 Sulut 18,329,055 41,505,118 2011 Sulteng 26,429,347 44,317,855 2011 Sulsel 66,264,062 137,389,879 2011 Sultra 16,565,955 32,032,499 2011 Gorontalo 6,334,898 9,153,669 2011 Sulbar 8,460,490 12,895,358 2011 Maluku 6,647,679 9,953,798 2011 Malut 4,096,729 6,056,974 2011 Papua Barat 13,139,228 36,170,456 2011 Papua 41,897,884 77,778,807
Dependent Variable: CNOM
Method: Least Squares Sample: 1 33
Included observations: 33
Variable Coefficient Std. Error t-Statistic Prob. C -7804272. 8755482. -0.891358 0.3796
PDRBNOM 0.579068 0.027567 21.00587 0.0000
R-squared 0.934356 Mean dependent var 97880208 Adjusted R-squared0.932239 S.D. dependent var 1.58E+08 S.E. of regression 41163147 Akaike info criterion 37.96268 Sum squared resid 5.25E+16 Schwarz criterion 38.05337
Log likelihood -624.3842 Hannan-Quinn criter. 37.99319 F-statistic 441.2464 Durbin-Watson stat 2.084886
Prob(F-statistic) 0.000000
Data Panel
Gabungan data
cross
section
dan data
time
series
dari beberapa
individu pada suatu
rentang periode waktu
Contoh: data konsumsi
dan PDRB seluruh provinsi
di Indonesia tahun
2005-2011
19
TAHUN PROV CNOM PDRBNOM
2005 NAD 23,714,220 74,749,396 2005 Papua 17,507,402 55,547,380
2006 NAD 23,841,964 77,531,003 2006 Papua 18,487,226 52,456,465 2007 NAD 23,320,136 71,093,359 2007 Papua 21,096,521 56,223,825 2008 NAD 22,745,713 67,567,800 2008 Papua 24,265,342 56,587,621 2009 NAD 24,322,278 62,135,388 2009 Papua 27,431,494 67,686,508 2010 NAD 26,347,969 64,805,564 2010 Papua 30,306,071 74,100,303 2011 NAD 27,644,870 66,978,284 2011 Papua 33,467,436 62,128,610
Pertimbangan Cara
Pengambilan?
(Wooldridge, 2005)
Feasibility
: Data cross section dan Time
series lebih murah daripada Panel Data
Information: Kandungan informasi yang
dimiliki oleh Data Panel adalah terbaik jika
dibandingkan dengan Data cross section
dan Time series
Kebutuhan: Analisis ekonometrika lanjut
membutuhkan data yang bersifat panel.
21
Data panel merupakan observasi dari unit-unit
ekonomi yang sama selama (
cross-section
)
beberapa kurun waktu tertentu (
time series
)
Data umumnya diperoleh melalui survey yang
berulang atau dengan mengikuti perkembangan
sample
selama beberapa kurun waktu
Nama lain panel data:
Time series cross section data
Longitudinal data
Micropanel data
Cohort analysis
PANEL DATA
Panel Data merupakan gabungan antara data
time
series
dan
cross section
dalam suatu model.
Beberapa keuntungan (Baltagi
dalam
Gujarati, 2003):
Lebih informatif, variatif, dan mengurangi
kolinearitas
Dinamika perubahan
Unobserved
faktor (
cross section
dan
time series
)
Model perilaku: misal
economies of scale
Keterbatasan Panel Data
Masalah dalam desain survey panel, pengumpulan
dan manajemen data (Masalah yang umum
dihadapi diantaranya : cakupan (
coverage
),
kemampuan daya ingat responden (
recall
),
frekuensi dan waktu wawancara.
Kesalahan pengamatan (
measurement errors
) yang
umumnya terjadi karena kegagalan respon (ex:
pertanyaan yg tdk jelas, ketidaktepatan informasi,
etc)
Masalah
attrition
(jumlah responden yang berkurang
pada survey lanjutan)
Setiap ahli ekonomi yang menggunakan
panel data atau jenis data lainnya
harus selalu menyadari bahwa setiap metode
Beberapa Tipe Panel Data
Struktur
Individu, i = 1, 2, ... , N.
Waktu, t = 1, 2, ... , T, untuk setiap i.
Lazimnya N berukuran besar dan T berukuran kecil.
Ukuran N yang besar and T yang kecil (data rumah
tangga, industri).
Ukuran N kecil and T besar (data makroekonomi
advanced dan emerging market).
Kedua-duanya besar (produksi dan ekspor impor
Micro panel
: data industri dan rumah tangga
Panel Study of Income Dynamic, US The Indonesia Family Life Survey
http:www.rand.org/FLS/IFLS),
SUSENAS
BHPS: British Household Panel Survey (Institute for Social
and Economic Research at the University of Essex)
GSOEP: German Socio-Economic Panel (German Institute
for Economic Research)
Canadian Survey of Labor Income Dynamics Japanese Panel on Consumers
Korea Labor and Income Panel Surveys
Household Income and Labor Dynamics in Australia
Macro panel
: Purchasing Power Parity (PPP), GDP or
GNI
Sumber
macro panel data
antara lain:
World Development Indicators
(
www.worldbank.org/data
)
Statistik perdagangan dan keuangan
MODEL PANEL DATA
Composite error term Bervariasi antar
individu
Normally distributed error
i : individu (cross section) t : waktu (time series)
it
kit
k
it
it
it
x
x
x
y
0
1
1
2
2
...
it
i
it
a
u
v
~
(
0
,
)
2
u it
N
Struktur
Data
Individu 1
Periode 1
Periode T
Periode 1
Periode T
Periode 1
Periode T Individu 2
Individu N
Fixed Effect Panel Model
Panel data dapat memiliki dua faktor tidak
terobservasi (unobserved factors) yang mempengaruhi variabel terikat yang bersifat:
1. konstan antar observasi cross section 2. konstan antar observasi time series
...(1)
berpengaruh terhadap setiap observasi
konstanta yang bersifat spesifik terhadap setiap unit waktu
konstanta yang bersifat spesifik pada unit cross section
(disebut sebagai fixed effect atau unobserved heterogeneity), ia tidak berubah dari waktu ke waktu.
Estimasi terhadap persamaan (1) sulit, karena
terdapat dalam model.
Dilakukan modifikasi:
; t = 1,2
adalah composite error
Jika dapat diasumsikan bahwa dan tidak
berkorelasi, maka OLS tidak bias.
Namun sulit dipenuhi, hal ini karena
adalah
konstanta yang bersifat spesifik pada unit
cross section, sehingga berubahnya
karena berubahnya unit cross section juga
akan mengubah
.
Teknik mengatasi masalah tersebut:
1.
First differencing
(FD)
2.
Fixed effect model
(FE)
FD dilakukan dengan cara mengurangkan nilai
suatu variabel yang langsung berurutan.
Fixed Effects umumnya digunakan ketika terjadi korelasi antara konstanta yang bersifat individu dengan variabel independen.
Dikenal dengan least squares dummy variable model
(LSDV): metode OLS dengan variabel dummy dengan
intersep diasumsikan berbeda antar unit wilayah.
Fixed Effects Model
Memperlakukan sebagai konstanta
untuk setiap individu:
Bagian dari konstanta
i
it
it
k
kit
it
it
a
x
x
x
u
Slope adalah BB.
Disebut within transformation. “Within” karena
menggunakan
deviasi
dari rataan data setiap
individu sepanjang waktu.
Persamaan (4) diestimasi dengan Pooled OLS
Metode
Fixed effects
transformation
(FE)
Random Effects digunakan ketika unobserved effect dapat diasumsikan tidak berkorelasi dengan satu atau lebih variabel bebas.
Dengan kata lain,
Memodelkan dengan composite error term:
selalu ada pada setiap composite error term pada setiap waktu maka mengalami serial correlation. Dikoreksi dengan prosedur GLS (lihat Wooldridge,
1999).
Random Effect Panel Model
it i
itk it
it
x
x
a
u
y
0
1
...
1
0
)
,
(
x
itja
i
Cov
it itk
it
it
x
x
v
Pendekatan ini tepat bila observasi lebih
merupakan sampel, bukan keseluruhan
populasi
Struktur Varians pada Random Effects
Pada random effects, diasumsikan aiadalah bagian
dari error term vit.
Untuk mendapatkan estimator yang efisien, harus
dilakukan modifikasi pada struktur error.
Penerapan GLS dapat memberikan estimator yang
efisien
yang menghendaki berbagai asumsi berikut
Asumsi ini paling krusial untuk
mendapatkan estimator yang
konsisten, yang berikutnya akan diuji
dengan Hausman test.
Tahapan dan Prosedur
Pengujian Model Panel Data
1. Pool OLS
2. Fixed Effects Model
3. Random Effects
Model
41
Chow Test
Chow Test
Pool OLS vs Fixed Effects
Hipotesa:
Ho : Pool lebih baik
Hi : Fixed lebih baik
Jika signifikan (menolak Ho) maka Fixed
effect lebih tepat digunakan, dan
sebaliknya.
Jika hasil uji signifikan, maka kemudian
dilanjutkan untuk estimasi Random effect.
Uji Hausman
43
Uji terhadap model random effects (RE)
atau model fixed effects (FE)
RE sebagai benchmark (null hipotesis),
menguji hubungan antara
a
idengan
x
it
H
0: E(a
i|x
it) = 0
Jika menolak null (signifikan) maka model
Referensi
Gujarati, D. 2004.
Basic Econometrics, 4
thEd
.
New York: McGraw-Hill Book Company.
Baltagi, B.H. 2005.
Econometric Analysis of
Panel Data, 3
rdEd
. New York: John Wiley &
Sons, Ltd
Baltagi, B.H. 2008.
Econometrics, 4
thEd
.
Heidelberg: Springer