ekonometrika panel data setyo

(1)

EKONOMETRIKA

PANEL DATA

Setyo Tri Wahyudi, SE., M.Ec., Ph.D

Jurusan Ilmu Ekonomi

Fakultas Ekonomi dan Bisnis

Universitas Brawijaya

(2)

PENDAHULUAN

 Econometrics: gabungan Economics dan Metrics atau

economic measurement (mengukur variabel-variabel ekonomi) (Gujarati, 2004)

 Beberapa definisi ttg Econometrics adalah sebagai

berikut:

 The quantitative analysis of actual economic

phenomena based on the concurrent development of theory and observation, related by appropriate methods of inference (Samuelson, et al., 1954)

 The social science in which the tools of economic

theory, mathematics, and statistical inference are applied to the analysis of economic phenomena (Goldberger, 1964)

 Concern with the empirical determination of

economic laws (Theil, 1971)

 Istilah ekonometrika diperkenalkan tahun 1926 oleh

Ragner Frisch (pakar ekonomi dan statistik Norwegia)

(3)

3

Teori Ekonomi Matematika _Ekonomi Statistika Ekonomi

Menjelaskan fenomena ekonomi

secara kuantitatif

Menyatakan teori ekonomi dalam bentuk

matematik (hubungan antar variabel)

Proses pengumpulan data, pengolahan, dan

penyajian data (grafik dan tabel)

Contoh:

Jika P↓ maka D↑ (T. mikro)  hubungan (-) P dan D

 Berapa perubahan D (?)

1. Deskriptif (S-D curves, market equilibrium, elasticity, etc) 2. Inferensi (t-test,

F-test, R2₎ 1. Linear equation

(slope, etc) 2. Differential

(elasticity, utility, etc)

Econometrics

Tools/alat: SPSS, E-Views, SAS, STATA, SHAZAM, R, etc.

Gabungan ketiganya untuk analisis:

- _{Koefisien hubungan antar variabel} - _{Interpretasi hasil secara ekonomi}

(4)

Tujuan Ekonometrika

1. Verifikasi

membuktikan atau menguji validitas

teori-teori ekonomi

2. Estimasi (penaksiran)

menghitung nilai estimasi koefisien

hubungan antar variabel ekonomi

3. Forecasting (peramalan)

meramal suatu variabel ekonomi

tertentu di masa yang akan datang

(5)

Metode Ekonometrika

5

1. Economic theory

2. Mathematical model of theory 3. Econometric model of theory

4. Data

5. Estimation of econometric model

6. Hypothesis testing

7. Forecasting or prediction

(6)

Contoh: MPC

1. Statement of theory or hypothesis

Teori Keynesian: MPC (marginal propensity to consume)

Perubahan tingkat konsumsi akibat perubahan

pendapatan 1 unit (misal 1 dollar) adalah lebih dari 0 tetapi kurang dari 1 (0 < MPC < 1)

6

2. Specification of the mathematical model of consumption

Fungsi konsumsi Keynesian: Y = β₁ + β₂X; 0 < β₂ < 1 Y : pengeluaran konsumsi X : income

β₁ dan β₂: parameter model β₁ : intercept

(7)

3. Specification of the econometric model of consumption

Spesifikasi matematis model konsumsi (Y = β₁ + β₂X)

dimodifikasi menjadi model ekonometrik: Y = β₁ + β₂X + u; u : error term

(8)

4. Obtaining Data

Estimasi model ekonometrika  memperoleh

nilai β

₁

dan β

₂

 diperlukan DATA

(9)

5. Estimation of the Econometric Model

Estimasi parameter fungsi konsumsi (β₁ dan β₂)  teknik statistik  ANALISIS REGRESI

Selama tahun 1982-1996, koefisien slope (MPC) sekitar 0.70 interpretasi:

 Selama tahun 1982-1996, kenaikan pendapatan riil 1

dollar meningkatkan pengeluaran konsumsi riil rata-rata 70 sen

 Hubungan konsumsi dan pendapatan kurang tepat

(inexact)  tidak semua titik secara tepat berada di

garis regresi 9

(10)

6. Hypothesis Testing

Asumsi: model ekonometrika cukup baik menyatakan kondisi riil

Teori Keynesian: 0 < MPC < 1 Data empiris: MPC = 0.70

Uji hipotesis: apakah 0.70 secara statistik kurang dari satu?

10

7. Forecasting or Prediction

Diketahui:

GDP tahun 1997 = 7269.8 billion dollars

Maka: ₁₉₉₇ = -184.0779 + 0.7064(7269.8) = 4951.3167

Forecast consumption expenditure = 4951.3 billion dollars

Actual consumption expenditure = 4913.5 billion dollars

Model estimasi fungsi konsumsi overpredicted terhadap nilai aktual sebesar 37.82 billion dollars  forecast error = 37.82 billion dollars (sekitar 0.77% dari actual consumption

(11)

8. Use of the model for control or policy purposes

Misal fungsi konsumsi: =-184.0779 + 0.7064X_i

Misal pemerintah percaya bahwa pengeluaran

konsumsi 4900 billion dollar akan mempertahankan tingkat pengangguran sebesar 4.2%.

Berapa tingkat pendapatan untuk mencapai target tersebut?

4900 = 184.0779 + 0.7064X  X = 7197

Dengan tingkat pendapatan 7197 billion dollar dan MPC 0.7 akan menghasilkan pengeluaran konsumsi 4900 billion dollars



(12)

Tahapan Analisis Ekonometrika

12

Identifikasi dan perumusan masalah

Kerangka Pemikiran

Spesifikasi Model

Pengumpulan Data

Estimasi Parameter

Evaluasi/Validasi Model

Aplikasi Model untuk Rumusan Kebijakan

Teori ekonomi dan konsep2 terkait

Kajian studi-studi terdahulu

Pemilihan variabel terkait Hipotesis (tanda dan

besaran) Data Primer Data

Sekunder

Cross-Section Time Series

Panel

OLS, MLE, ILS, 2SLS, etc  BLUE

Krit. Ekonomi (besaran & tanda)

Krit. Statistik (signifikansi, koef det)

(13)

Metodologi Ekonometrika

Berdasarkan Jenis Data

13

DATA

Cross Section Time Series PANEL

Univariate Multivariate

Correlation Regression Multivariate analysis

Regression AR, MA ARMA ARIMA

ARCH, GARCH

Correlation Regression Granger Causality VAR

ECM, VECM

Pooled

(14)

Tipologi data



Data Nominal:

bersifat kualitatif, tidak memiliki

arti urutan. Misal: Laki = 1; Perempuan = 2



Data Ordinal:

bersifat kualitatif, memiliki arti

urutan. Misal: Juara 1; Juara 2; Juara 3



Data Interval:

bersifat kuantitatif/numeris,

tidak memiliki nilai nol absolut (sehingga rasio

antar data tidak memiliki arti). Misal: Suhu 10

C dan 20 C, bukan berarti 20 C tdk sama

dengan 2 kali 10 C



Data Rasio:

bersifat kuantitatif/numeris,

memiliki nilai nol absolut. Misal: Tinggi badan

(15)

Cara Pengambilan Data



Nilai variabel dari suatu

individu pada suatu

rentang periode waktu



Periode waktu bisa

berupa periode harian,

mingguan, bulanan,

triwulanan, tahunan dsb



Contoh: data konsumsi

dan PDB Indonesia

periode tahun 2000-2010

15

TAHUN CRIIL PDBRIIL

2000 856,798 1,265,890 2001 886,736 1,277,342 2002 920,750 1,316,776 2003 956,593 1,351,205 2004 1,004,109 1,447,182 2005 1,043,805 1,521,194 2006 1,076,928 1,585,488 2007 1,130,847 1,689,149 2008 1,191,191 1,836,356 2009 1,249,011 1,875,616 2010 1,306,801 2,020,875

DATA KONSUMSI DAN PDB RIIL INDONESIA (Juta Rp) (2000=100)

(16)

16

fungsi konsumsi: = 171287.1 + 0.57X_i Y : CRIIL (konsumsi riil)

X : PDBRIIL (PDB riil)

Dependent Variable: CRIIL Method: Least Squares Sample: 2000 2010

Included observations: 11

Variable Coefficient Std. Error t-Statistic Prob. C 171287.1 32101.87 5.335737 0.0005

PDBRIIL 0.566671 0.020287 27.93258 0.0000

R-squared 0.988596 Mean dependent var 1056688. Adjusted R-squared0.987329 S.D. dependent var 149603.9 S.E. of regression 16839.97 Akaike info criterion 22.46386 Sum squared resid 2.55E+09 Schwarz criterion 22.53621

Log likelihood -121.5512 Hannan-Quinn criter. 22.41826 F-statistic 780.2293 Durbin-Watson stat 1.347252

Prob(F-statistic) 0.000000

TAHUN CRIIL PDBRIIL

2000 856,798 1,265,890 2001 886,736 1,277,342 2002 920,750 1,316,776 2003 956,593 1,351,205 2004 1,004,109 1,447,182 2005 1,043,805 1,521,194 2006 1,076,928 1,585,488 2007 1,130,847 1,689,149 2008 1,191,191 1,836,356 2009 1,249,011 1,875,616 2010 1,306,801 2,020,875

DATA KONSUMSI DAN PDB RIIL INDONESIA

(17)

Data Cross Section



Nilai variabel dari

beberapa individu pada

satu periode waktu yang

sama



Individu bisa berupa

negara, provinsi,

perusahaan, perorangan,

dsb



Contoh: data konsumsi

dan PDRB seluruh

provinsi di Indonesia

tahun 2011

17

TAHUN PROV CNOM PDRBNOM

2011 NAD 35,305,263 85,537,966 2011 Sumut 186,029,226 314,156,937 2011 Sumbar 53,011,431 98,917,269 2011 Riau 128,118,434 413,350,123 2011 Jambi 37,891,889 63,268,138 2011 Sumsel 115,478,933 181,776,073 2011 Bengkulu 12,780,991 21,150,290 2011 Lampung 65,624,263 128,408,895 2011 Babel 15,598,162 30,254,777 2011 Kepri 61,555,344 80,242,794 2011 DKI 542,133,712 982,540,044 2011 Jabar 510,388,750 861,006,348 2011 Jateng 320,409,013 498,614,636 2011 DIY 26,319,645 51,782,092 2011 Jatim 597,413,773 884,143,575 2011 Banten 85,637,614 192,218,910 2011 Bali 44,398,065 73,478,162 2011 NTB 22,768,353 48,729,107 2011 NTT 22,450,911 31,204,406 2011 Kalbar 35,357,043 66,780,222 2011 Kalteng 21,935,482 49,072,507 2011 Kalsel 31,772,043 68,234,881 2011 Kaltim 49,503,200 390,638,617 2011 Sulut 18,329,055 41,505,118 2011 Sulteng 26,429,347 44,317,855 2011 Sulsel 66,264,062 137,389,879 2011 Sultra 16,565,955 32,032,499 2011 Gorontalo 6,334,898 9,153,669 2011 Sulbar 8,460,490 12,895,358 2011 Maluku 6,647,679 9,953,798 2011 Malut 4,096,729 6,056,974 2011 Papua Barat 13,139,228 36,170,456 2011 Papua 41,897,884 77,778,807

(18)

18

fungsi konsumsi: =-7804272 + 0.58X_i Y : CNOM (konsumsi nominal)

X : PDRBNOM (PDRB nominal)

2011 NAD 35,305,263 85,537,966 2011 Sumut 186,029,226 314,156,937 2011 Sumbar 53,011,431 98,917,269 2011 Riau 128,118,434 413,350,123 2011 Jambi 37,891,889 63,268,138 2011 Sumsel 115,478,933 181,776,073 2011 Bengkulu 12,780,991 21,150,290 2011 Lampung _{65,624,263 128,408,895} 2011 Babel 15,598,162 30,254,777 2011 Kepri 61,555,344 80,242,794 2011 DKI 542,133,712 982,540,044 2011 Jabar 510,388,750 861,006,348 2011 Jateng 320,409,013 498,614,636 2011 DIY 26,319,645 51,782,092 2011 Jatim 597,413,773 884,143,575 2011 Banten 85,637,614 192,218,910 2011 Bali 44,398,065 73,478,162 2011 NTB 22,768,353 48,729,107 2011 NTT 22,450,911 31,204,406 2011 Kalbar 35,357,043 66,780,222 2011 Kalteng 21,935,482 49,072,507 2011 Kalsel 31,772,043 68,234,881 2011 Kaltim 49,503,200 390,638,617 2011 Sulut 18,329,055 41,505,118 2011 Sulteng 26,429,347 44,317,855 2011 Sulsel 66,264,062 137,389,879 2011 Sultra 16,565,955 32,032,499 2011 Gorontalo 6,334,898 9,153,669 2011 Sulbar 8,460,490 12,895,358 2011 Maluku 6,647,679 9,953,798 2011 Malut 4,096,729 6,056,974 2011 Papua Barat 13,139,228 36,170,456 2011 Papua 41,897,884 77,778,807

Dependent Variable: CNOM

Method: Least Squares Sample: 1 33

Included observations: 33

Variable Coefficient Std. Error t-Statistic Prob. C -7804272. 8755482. -0.891358 0.3796

PDRBNOM 0.579068 0.027567 21.00587 0.0000

R-squared 0.934356 Mean dependent var 97880208 Adjusted R-squared0.932239 S.D. dependent var 1.58E+08 S.E. of regression 41163147 Akaike info criterion 37.96268 Sum squared resid 5.25E+16 Schwarz criterion 38.05337

Log likelihood -624.3842 Hannan-Quinn criter. 37.99319 F-statistic 441.2464 Durbin-Watson stat 2.084886

Prob(F-statistic) 0.000000

(19)

Data Panel



Gabungan data

cross

section

dan data

time

series

dari beberapa

individu pada suatu

rentang periode waktu



Contoh: data konsumsi

dan PDRB seluruh provinsi

di Indonesia tahun

2005-2011

19

2005 NAD 23,714,220 74,749,396 2005 Papua 17,507,402 55,547,380

2006 NAD 23,841,964 77,531,003 2006 Papua 18,487,226 52,456,465 2007 NAD 23,320,136 71,093,359 2007 Papua 21,096,521 56,223,825 2008 NAD 22,745,713 67,567,800 2008 Papua 24,265,342 56,587,621 2009 NAD 24,322,278 62,135,388 2009 Papua 27,431,494 67,686,508 2010 NAD 26,347,969 64,805,564 2010 Papua 30,306,071 74,100,303 2011 NAD 27,644,870 66,978,284 2011 Papua 33,467,436 62,128,610

(20)

Pertimbangan Cara

Pengambilan?

(Wooldridge, 2005)



Feasibility

: Data cross section dan Time

series lebih murah daripada Panel Data



Information: Kandungan informasi yang

dimiliki oleh Data Panel adalah terbaik jika

dibandingkan dengan Data cross section

dan Time series



Kebutuhan: Analisis ekonometrika lanjut

membutuhkan data yang bersifat panel.

(21)

21



Data panel merupakan observasi dari unit-unit

ekonomi yang sama selama (

cross-section

)

beberapa kurun waktu tertentu (

time series

)



Data umumnya diperoleh melalui survey yang

berulang atau dengan mengikuti perkembangan

sample

selama beberapa kurun waktu



Nama lain panel data:

Time series cross section data

Longitudinal data

Micropanel data

Cohort analysis

(22)

PANEL DATA

Panel Data merupakan gabungan antara data

time

series

dan

cross section

dalam suatu model.

Beberapa keuntungan (Baltagi

dalam

Gujarati, 2003):



Lebih informatif, variatif, dan mengurangi

kolinearitas



Dinamika perubahan



Unobserved

faktor (

cross section

dan

time series

)



Model perilaku: misal

economies of scale

(23)

Keterbatasan Panel Data



_{Masalah dalam desain survey panel, pengumpulan}

dan manajemen data (Masalah yang umum

dihadapi diantaranya : cakupan (

coverage

),

kemampuan daya ingat responden (

recall

),

frekuensi dan waktu wawancara.



_{Kesalahan pengamatan (}

_{measurement errors}

_{) yang}

umumnya terjadi karena kegagalan respon (ex:

pertanyaan yg tdk jelas, ketidaktepatan informasi,

etc)



_Masalah

_attrition

_{(jumlah responden yang berkurang}

pada survey lanjutan)

(24)

Setiap ahli ekonomi yang menggunakan

panel data atau jenis data lainnya

harus selalu menyadari bahwa setiap metode

(25)

Beberapa Tipe Panel Data

 Struktur

Individu, i = 1, 2, ... , N.

Waktu, t = 1, 2, ... , T, untuk setiap i.

Lazimnya N berukuran besar dan T berukuran kecil.

 Ukuran N yang besar and T yang kecil (data rumah

tangga, industri).

 Ukuran N kecil and T besar (data makroekonomi

advanced dan emerging market).

 Kedua-duanya besar (produksi dan ekspor impor

(26)

Micro panel

: data industri dan rumah tangga

 Panel Study of Income Dynamic, US  The Indonesia Family Life Survey

http:www.rand.org/FLS/IFLS),

 SUSENAS

 BHPS: British Household Panel Survey (Institute for Social

and Economic Research at the University of Essex)

 GSOEP: German Socio-Economic Panel (German Institute

for Economic Research)

 Canadian Survey of Labor Income Dynamics  Japanese Panel on Consumers

 Korea Labor and Income Panel Surveys

 Household Income and Labor Dynamics in Australia

(27)

Macro panel

: Purchasing Power Parity (PPP), GDP or

GNI

Sumber

macro panel data

antara lain:



World Development Indicators



(

www.worldbank.org/data

)



Statistik perdagangan dan keuangan

(28)

MODEL PANEL DATA

Composite error term Bervariasi antar

individu

Normally distributed error

i : individu (cross section) t : waktu (time series)

it

kit

k

it

x

y





₀





₁





₂



...









it

i

it

a

u

v





~

(

0 ,

)

2

u it

N

(29)

Struktur

Data

Individu 1

Periode 1

Periode T

Periode 1

Periode T

Periode 1

Periode T Individu 2

Individu N

(30)

Fixed Effect Panel Model

 Panel data dapat memiliki dua faktor tidak

terobservasi (unobserved factors) yang mempengaruhi variabel terikat yang bersifat:

1. konstan antar observasi cross section 2. konstan antar observasi time series

 ...(1)

 berpengaruh terhadap setiap observasi

 konstanta yang bersifat spesifik terhadap setiap unit waktu

 konstanta yang bersifat spesifik pada unit cross section

(disebut sebagai fixed effect atau unobserved heterogeneity), ia tidak berubah dari waktu ke waktu.

(31)



Estimasi terhadap persamaan (1) sulit, karena

terdapat dalam model.



Dilakukan modifikasi:

; t = 1,2



adalah composite error



Jika dapat diasumsikan bahwa dan tidak

berkorelasi, maka OLS tidak bias.



Namun sulit dipenuhi, hal ini karena

adalah

konstanta yang bersifat spesifik pada unit

cross section, sehingga berubahnya

karena berubahnya unit cross section juga

akan mengubah

.



(32)



Teknik mengatasi masalah tersebut:

1. First differencing

(FD)

2. Fixed effect model

(FE)



FD dilakukan dengan cara mengurangkan nilai

suatu variabel yang langsung berurutan.

 Fixed Effects umumnya digunakan ketika terjadi korelasi antara konstanta yang bersifat individu dengan variabel independen.

 Dikenal dengan least squares dummy variable model

(LSDV): metode OLS dengan variabel dummy dengan

intersep diasumsikan berbeda antar unit wilayah.

(33)

Fixed Effects Model

Memperlakukan sebagai konstanta

untuk setiap individu:

Bagian dari konstanta



_i



_it

_k

_kit

_it

it

a

x

u

(34)

(35)

Slope adalah BB.

(36)

(37)



_{Disebut within transformation. “Within” karena}

menggunakan

deviasi

dari rataan data setiap

individu sepanjang waktu.



_{Persamaan (4) diestimasi dengan Pooled OLS}

Metode

Fixed effects

transformation

(FE)

(38)

 Random Effects digunakan ketika unobserved effect dapat diasumsikan tidak berkorelasi dengan satu atau lebih variabel bebas.

 Dengan kata lain,

 Memodelkan dengan composite error term:

 selalu ada pada setiap composite error term pada setiap waktu maka mengalami serial correlation.  Dikoreksi dengan prosedur GLS (lihat Wooldridge,