• Tidak ada hasil yang ditemukan

PPT 東京大学公共政策大学院教材 - Rieti

N/A
N/A
Protected

Academic year: 2023

Membagikan "PPT 東京大学公共政策大学院教材 - Rieti"

Copied!
31
0
0

Teks penuh

(1)

事例研究 ( ミクロ経済政策・問題分析 I) - 規制産業と料金・価格制度 -

(#503 –

パネルデータ分析の応用

(1)) 2017

12

戒能一成

(2)

0. 本講の目的    ( 手法面)

- 応用データ解析の手法のうち、パネルデータ

    分析の概要を理解する

(内容面 )

- 計量経済学・統計学を実戦で応用する際の 留意点を理解する

           

(3)

1.

パネルデータ分析とは

1-1.

パネルデータ分析 (

Longitudinal/Panel Data)

  

  

-

パネルデータ分析とは、複数の対象・複数の時    点に関するデータを用いた回帰分析をいう

   (注 ; 対象 x 時点 だけでなく、稀に 対象 x 対象

       対象 x 対象 x 時点 などの場合あり

)

-

パネルデータ分析の利点は多数あるが、実務上

   下記 3 点が非常に重要

・ 試料数が限られる場合の有効な計測

← 「自由度」の確保

・ 膨大な試料からの特定の効果・影響の計測 ・ 複数対象に横断的な効果・影響の計測

(4)

異質性が存在

1. パネルデータ分析とは

1-2. パネルデータ分析の概念図

 

- パネルデータ分析とは、複数の対象・複数の時

   点に関するデータを用いた回帰分析をいう

  時間 →   0 1   ・・・ t

(制度変更

) ・・・ n

(2017)

対象

↓ X1 y10 y11 ・・・ y1t (

変更

) ・・・ y1n (

変更

)

X2 y20 y21 ・・・ y2t (

変更

) ・・・ y2n (

変更

)

X3 y30 y31 ・・・ y3t ( -- ) ・・・ y3n ( -- )

X4 y40 y41 ・・・ y4t ( -- ) ・・・ y4n ( -- )

パネルデータ分析 ( 複数対象・複数時点 )

→ 外的要因変化と対象 異質性の同時除去

(5)

1. パネルデータ分析とは

1-3. パネルデータ分析と異質性

  

   - パネルデータ分析において、対象の選択の際に    なるべく異質性の少ない対象を選ぶ必要あり     ・ 企業 → 業種 , 売上高 , 従業員数 ・・・

    ・ 家計 → 所得 , 世帯員数 , 居住地域 ・・・

   - 異質性を管理せずにパネルデータ分析をしても

   単なる対象別の時系列分析と比べて精度・分解

   能などが向上せず利点が活かせない場合あり

   - また一般の公的統計調査からパネルデータを

   作成する場合、「対象主体の入れ替わり」に

   よる暗黙裏の異質性に注意が必要

(6)

1.

パネルデータ分析とは

1-4.

パネルデータ分析と特定化の問題

  

  

-

パネルデータ分析においては、個々の対象別の    特性をどこまでモデルに反映させるか、という    モデルの特定化の問題を考える必要あり

    ・ 固定効果モデル → 対象別の特性を識別     ・ 変量効果モデル → 対象別の特性は「誤差」

        (対象別の「誤差」を別途設 定

)

    ・ プールモデル  → 対象別の特性を無視

        (時間・対象を識別しない「誤 差」

)

(7)

1.

パネルデータ分析とは

1-5.

パネルデータと「欠測」

  

  

-

パネルデータ分析において「対象主体の入替り」

   を特段の問題としないのであれば、特定の対象 のデータの一時的な「欠測」は問題とならない

     ・ 対象主体の出現・消滅 (起業・廃業など

)

     ・ データの取得不可 (不提出・自然災害など

)

   

(

「アンバランスド・パネルデータ」という

)

   ← 通常の時系列分析に対する優位性の一つ  

-

特定の年度が一時的に「欠測」の場合も同様      ・ 調査の年度が連続しない場合

     ・ 統計調査が実施されていない場合

(8)

2.

パネルデータ分析と時系列分析

2-1.

時系列分析

(ARMAX)

の成立条件 [復習

]

  

-

系列相関の消滅

No Serial/Auto Correlation → 系列相関が発生しないか消滅していること

-

変数の(弱 )定常性

Weakly Stationary Variables

→ 変数は弱定常性条件を満たすこと

      (変数が単調増加・減少を続けていないこと

) -

因果一方向性   

No Reverse Causality

被説明変数

(y)

から説明変数

(xi)

への因果性       が存在しないこと

← パネルデータ分析は系列相関対策に有効

(9)

2.

パネルデータ分析と時系列分析

2-2.

パネルデータ分析と時間による系列相関

  

-

パネルデータ分析では、一般に計測において

   時間方向の系列相関が発生することは少ない     → 個々の対象のデータに系列相関が存在

      しても、複数の対象のデータを用いれば       系列相関は問題とならない場合が多い

-

しかし念のため系列相関の検定を掛けるべき

-

つまりパネルデータ分析は「ラグ項」が存在しな

   いことを保証している訳ではない

    → 先ず通常の時系列分析を行いラグ構造を      把握・検討すべき

(

「ダイナミックパネル分

析」

)

(10)

2.

パネルデータ分析と時系列分析

2-3.

パネルデータ分析での「組織」の系列相関

  

-

パネルデータ分析において、データを構成する対

象の一部に組織関係による系列相関 (血縁・友

   人関係、取引関係・資本関係などに起因した個    人・企業間の相関 )があると誤差が異常に小さく    なり「偽の有意性」が出る場合有(

Moulton

効果)

 

-

同様に対象を何かのパラメータ順・組織順等で    周回的なデータを構築すると (擬似的な )系列相    関が現れ同様の問題を生じる場合あり

     ← いずれもパネルデータに特徴的現象   

-

対策はGLSの利用

(=

計量ソフトの利用

)

(11)

2.

パネルデータ分析と時系列分析

2-4.

パネルデータ分析と定常性

  

-

パネルデータ分析においても、各変数の定常性

   について必ず確認が必要

    → 定常でない個々の対象のデータにつき複数       対象のデータを集めてきても、定常性の問

      がなくなる訳ではない

-

パネルデータでの定常性検定については、

ADF

検定の一種である

Fisher Type ADF

検定を適 用

-

定常性検定が棄却された場合、通常の

ARMAX

モデル同様に階差データをとり対応する

(12)

2.

パネルデータ分析と時系列分析

2-5.

パネルデータ分析と因果一方向性

  

-

パネルデータ分析においても、 (個別に )因果の一

方向性について確認が必要

    → パネルデータ自体から因果性を判定する手      法は開発されているが未だ一般的でない  

-

因果の方向性検定は各説明変数毎に被説明変    数と

Granger

因果性検定を適用

(Pair wise

  

Granger Causality Test)

-

逆方向の因果性が検出された場合、モデル構造

   を見直す (変数を交換する )か、パネル

VAR

モデ    ルを構築; 「無意味解」「不安定解」を回避

(13)

3. パネルデータ分析の手法

3-1. パネルデータ分析の「安全な」手順

[ 重要

]

 

1)

通常の項目別時系列分析の試行

a-

逆方向因果性判定

(ARMAX or VAR)       b- 定常性判定 (定常化処理 )

      c- ラグ構造把握

   2) ( 1) を与件とした )

パネルデータ分析の試行

      (a-

逆方向因果性 – 通常の分析と共通

) b- パネル定常性判定 (定常化処理 )

c- ラグ項の選択・検討 ( 1) の結果を反映 )

     d - 固定効果・変量効果などモデル選択

    (e- 系列相関消滅の確認 (念のため ))

(14)

3.

パネルデータ分析の手法

3-2.

パネルデータ分析の種類

(1)

 

-

固定効果モデル

(Fixed Effect Model; “Within”)

個々の対象に対応したダミー変数を説明変数

     として設け、対象毎の異質性を管理した上で      「対象に横断的な変化」に着目した分析 

    

Y(i,t) = α + X(i,t)*β

fx

+ Σi DMi(1/0) + ε(i,t)

-

変量効果モデル

(Random Effect Model)

対象に対応したダミー変数を設けず、対象毎

     の (潜在的 )異質性を確率的現象と仮定       

Y(i,t) = α + X(i,t)*β

e

+ ε(i,t)

   (要

GLS)

(15)

3.

パネルデータ分析の手法

3-3.

パネルデータ分析の種類

(2)

 

-

ビトィーンモデル

(“Between” Model)

個々の対象・時間を識別するが、説明変数に

     対象の「平均値」を用いた回帰分析を行い、

     対象間の異質性に着目する分析

        (← 着目点が固定効果モデル

(“Within”)

の反対

,

使用頻度低

)

 

Y(i,t) = α + X average (i)*β be + ε(i,t)

-

プールモデル

(Pooled Model) (

通常の回帰分析

)

個々の対象・時間を識別せず、全てのデータ

     が均整に相関し誤差が均一と仮定した分析     

Y(i,t) = α + X(i,t) *β po + ε

(16)

3. パネルデータ分析の手法

3-4. パネルデータ分析の種類 (3)

 

y ;

被説明変数

対象

i

1

(

時間変化

)

対象

i

2

(時間変化

)

変量効果モデル

(“Overall”)

-

全体的変化に着目

(

誤差は対象別)

固定効果モデル

(“within”)

-

対象毎の変化に着目 固定効果モデル

(“within”)

-

対象毎の変化に着目 ビトウィーンモデル

(“Between”)

-

対象間の差異に着目

プールデータモデル

-

全体的変化に着目

(

誤差は均一

)

(17)

3.

パネルデータ分析の手法

3-5.

パネルデータ分析と検定

 

-

因果性検定

       →

Granger

因果性検定

-

定常性検定 (単位根検定

Unit root test) → パネル ADF

検定

(Fisher Type)

-

固定効果・変量効果・プールモデル検定

       →

Hausman

検定

      

STATA

の場合

; Ho:

 変量効果が 正

       →

Breusch-Pagan

検定   

-

系列相関検定

→ “Q”

検定

, Breusch Godfrey LM

検定

(18)

4. パネルデータ分析の実例

4-1. 都道府県別酒類消費量 ( 焼酎・清酒 )   

   

 

(1) 作図による概況確認 (P-Q 図 , 焼酎・清 酒 )

( 出典 : 総務省家計調査報告 , 2000-2013 暦年 )

20 40 60 80 100 120

(\/100ml, ) 年平均価格 名目

2000 20042008 2012

都道府県別焼酎年平均価格 消費量推移- ( 総務省家計調査報告, 2000-2013 )

20 40 60 80 100 120

(\/100ml, ) 年平均価格 名目

20002004 2008

都道府県別清酒年平均価格 消費量推移- ( 総務省家計調査報告, 2000-2013 )

(19)

4.

パネルデータ分析の実例

4-2.

都道府県別酒類消費量 (焼酎・清酒 )     

 

(2)

因果性判定

(Granger Causality Test)

  

(

結果省略

,

各県とも有意な逆因果性なし

)

 

(3)

単位根検定

(Unit Root Test, Fisher-ADF) (

結果省略

,

全て定常

)

  

(4)

モデル仮構築(必ず固定効果モデルから開始

)

     

ln(Qx ( i,t)) = Q

0

1

* ln(Px(i,t)) +β

2

*

ln(I(i,t))

3

* ln(Pz(i,t)) +Σi(β

4i

*DMi) + ε(i,t)

-

数量を価格・所得・代替財価格で回帰 (対数

)

   (本例では結果的に所得は殆どの場合有意でない )    

(20)

_cons -5.820162 1.336641 -4.35 0.000 -8.445165 -3.195159 lpses .3280074 .0917042 3.58 0.000 .1479114 .5081035 lphps 1.078908 .2781814 3.88 0.000 .5325932 1.625223 lpber 1.577454 .16328 9.66 0.000 1.256792 1.898116 lpshc -.6576098 .1216778 -5.40 0.000 -.8965703 -.4186493 lqshc Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = 0.1415 Prob > F = 0.0000 F(4,607) = 55.15 overall = 0.2343 max = 14 between = 0.3117 avg = 14.0 R-sq: within = 0.2666 Obs per group: min = 14 Group variable: kid Number of groups = 47 Fixed-effects (within) regression Number of obs = 658 . xtreg lqshc lpshc lpber lphps lpses, fe

4. パネルデータ分析の実例

4-3. 都道府県別酒類消費量 ( 焼酎 )      

 

(5a) 固定効果モデル推計 (Fixed Effect -)     

焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数)

定数項

(21)

sigma_e .24976559 sigma_u .21936878

_cons -5.893854 1.336897 -4.41 0.000 -8.514124 -3.273585 lpses .3588952 .0914573 3.92 0.000 .1796421 .5381482 lphps 1.08973 .2778987 3.92 0.000 .5450585 1.634401 lpber 1.625368 .1622299 10.02 0.000 1.307404 1.943333 lpshc -.7577282 .1160189 -6.53 0.000 -.9851211 -.5303353 lqshc Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 Wald chi2(4) = 230.97 overall = 0.2445 max = 14 between = 0.3212 avg = 14.0 R-sq: within = 0.2658 Obs per group: min = 14 Group variable: kid Number of groups = 47 Random-effects GLS regression Number of obs = 658 . xtreg lqshc lpshc lpber lphps lpses, re

4. パネルデータ分析の実例

4-4. 都道府県別酒類消費量 ( 焼酎 )      

 

(6a) 変量効果モデル推計 (Random Effect -)    

焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数)

定数項

(22)

4. パネルデータ分析の実例

4-5. 都道府県別酒類消費量 ( 焼酎 )      

 

(7a) Hausman 検定 ; モデル係数間の有意 差検定   

(V_b-V_B is not positive definite) Prob>chi2 = 0.0000

= 79.39

chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B) Test: Ho: difference in coefficients not systematic

B = inconsistent under Ha, efficient under Ho; obtained from xtreg b = consistent under Ho and Ha; obtained from xtreg lpses .3280074 .3588952 -.0308877 .0067247

lphps 1.078908 1.08973 -.0108218 .0125388 lpber 1.577454 1.625368 -.0479144 .0184887 lpshc -.6576098 -.7577282 .1001184 .0366754

SHCFX . Difference S.E.

(b) (B) (b-B) sqrt(diag(V_b-V_B)) Coefficients

. hausman SHCFX 固定効果 変量効果

「係数に差がない」

帰無仮説を棄却 (→ 固定効果)

(23)

4. パネルデータ分析の実例

4-6. 都道府県別酒類消費量 ( 焼酎 )      

 

(8a) プールモデル推計 (Pooled -)    

焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数)

定数項

Variables: fitted values of lqshc Ho: Constant variance

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest

_cons -6.729215 1.691285 -3.98 0.000 -10.05023 -3.408201 lpses .6314143 .1127055 5.60 0.000 .4101054 .8527232 lphps 1.184626 .3476947 3.41 0.001 .501892 1.867361 lpber 1.797425 .2027111 8.87 0.000 1.399381 2.195469 lpshc -1.228279 .1085202 -11.32 0.000 -1.441369 -1.015188 lqshc Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 101.488848 657 .154473132 Root MSE = .33838 Adj R-squared = 0.2587 Residual 74.7710575 653 .114503916 R-squared = 0.2633 Model 26.7177902 4 6.67944754 Prob > F = 0.0000 F( 4, 653) = 58.33 Source SS df MS Number of obs = 658 . reg lqshc lpshc lpber lphps lpses

(24)

4. パネルデータ分析の実例

4-6. 都道府県別酒類消費量 ( 焼酎 )      

 

(9a) 変量・プール検定 ( Breusch-Pagan 検 定)

Prob > chibar2 = 0.0000 chibar2(01) = 780.08 Test: Var(u) = 0

u .0481227 .2193688 e .0623829 .2497656 lqshc .1544731 .3930307 Var sd = sqrt(Var) Estimated results:

lqshc[kid,t] = Xb + u[kid] + e[kid,t]

Breusch and Pagan Lagrangian multiplier test for random effects . xttest0

「県別誤差の分散 0 帰無仮説を棄却

(→ 変量効果) 但し先のHausman

検定の結果から 固定効果モデルが適

(25)

4. パネルデータ分析の実例

4-7. 都道府県別酒類消費量 ( 焼酎 )

 

x ;

説明変数

(

対数価格

)

y ;

被説明変数

都道府県

i

1

(

時間変化

)

都道府県

i

2

(時間変化

)

プールデータモデル

(“

Pooled”) -

価格係数”

-1.23

固定効果モデル

(“within”)

-

対象毎の変化に着目 固定効果モデル

(“within”)

-

価格係数”

-0.66

(都道府県別

DM

)

変量効果モデル

(“overall”)

-

価格係数”

-0.76

(

都道府県別誤差有

)

(26)

4. パネルデータ分析の実例

4-8. 都道府県別酒類消費量 ( 清酒 )      

 

(5b) 固定効果モデル推計 (Fixed Effect -)     

清酒価格(対数) ビール価格(対数) 発泡酒価格(対数) 焼酎価格(対数)

定数項 _cons 23.26638 1.520089 15.31 0.000 20.2811 26.25165 lpshc -.5108565 .1383775 -3.69 0.000 -.7826132 -.2390999 lphps -.7384788 .3163605 -2.33 0.020 -1.359773 -.1171848 lpber -.4940239 .1856895 -2.66 0.008 -.8586957 -.1293522 lpses -1.059136 .1042902 -10.16 0.000 -1.263949 -.8543224 lqses Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = 0.0448 Prob > F = 0.0000 F(4,607) = 60.30 overall = 0.1890 max = 14 between = 0.1221 avg = 14.0 R-sq: within = 0.2844 Obs per group: min = 14 Group variable: kid Number of groups = 47 Fixed-effects (within) regression Number of obs = 658 . xtreg lqses lpses lpber lphps lpshc, fe

(27)

4. パネルデータ分析の実例

4-9. 都道府県別酒類消費量 ( 清酒 )      

 

(6b) 変量効果モデル推計 (Random Effect -)    

rho .60077246 (fraction of variance due to u_i) sigma_e .28404474

sigma_u .34844281

_cons 23.38788 1.514316 15.44 0.000 20.41987 26.35588 lpshc -.4932498 .1342173 -3.68 0.000 -.7563109 -.2301887 lphps -.7540022 .3148291 -2.39 0.017 -1.371056 -.1369484 lpber -.5024006 .1842086 -2.73 0.006 -.8634427 -.1413584 lpses -1.071173 .1036915 -10.33 0.000 -1.274404 -.8679409 lqses Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 Wald chi2(4) = 247.49 overall = 0.1896 max = 14 between = 0.1241 avg = 14.0 R-sq: within = 0.2843 Obs per group: min = 14 Group variable: kid Number of groups = 47 Random-effects GLS regression Number of obs = 658 . xtreg lqses lpses lpber lphps lpshc, re

清酒価格(対数) ビール価格(対数) 発泡酒価格(対数) 焼酎価格(対数)

定数項

(28)

4. パネルデータ分析の実例

4-10. 都道府県別酒類消費量 ( 清酒 )     

 

 

(7b) Hausman 検定 ; モデル係数間の有意 差検定   

固定効果 変量効果

「係数に差がない」

帰無仮説を保留 (→ 変量効果) Prob>chi2 = 0.7340

= 2.01

chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B) Test: Ho: difference in coefficients not systematic

B = inconsistent under Ha, efficient under Ho; obtained from xtreg b = consistent under Ho and Ha; obtained from xtreg lpshc -.5108565 -.4932498 -.0176067 .0336754

lphps -.7384788 -.7540022 .0155234 .03109 lpber -.4940239 -.5024006 .0083766 .0234046 lpses -1.059136 -1.071173 .0120368 .0111583

SECFX . Difference S.E.

(b) (B) (b-B) sqrt(diag(V_b-V_B)) Coefficients

. hausman SECFX

(29)

4. パネルデータ分析の実例

4-11. 都道府県別酒類消費量 ( 清酒 )     

 

 

(8b) プールモデル推計 (Pooled -)    

清酒価格(対数) ビール価格(対数)

発泡酒価格 lphps -1.016505 .4377506 -2.32 0.021 -1.876074 -.1569368 lpber -.5914338 .2673031 -2.21 0.027 -1.116311 -.0665565 lpses -1.275343 .1731425 -7.37 0.000 -1.615326 -.9353593 lqses Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust (対数)

Root MSE = .44287 R-squared = 0.1932 Prob > F = 0.0000 F( 4, 653) = 33.51 Linear regression Number of obs = 658 . reg lqses lpses lpber lphps lpshc, robust

Prob > chi2 = 0.0001 chi2(1) = 14.73

Variables: fitted values of lqses Ho: Constant variance

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest

(30)

4. パネルデータ分析の実例

4-12. 都道府県別酒類消費量 ( 清酒 )     

 

 

(9b) 変量・プール検定 ( Breusch-Pagan 検 定)   

「県別誤差の分散 0 帰無仮説を棄却

(→ 変量効果) 先のHausman検定

の結果と併せて 変量効果モデルが適 Prob > chibar2 = 0.0000

chibar2(01) = 1454.93 Test: Var(u) = 0

u .1214124 .3484428 e .0806814 .2840447 lqses .2416111 .4915396 Var sd = sqrt(Var) Estimated results:

lqses[kid,t] = Xb + u[kid] + e[kid,t]

Breusch and Pagan Lagrangian multiplier test for random effects . xttest0

(31)

4. パネルデータ分析の実例

4-13. 都道府県別酒類消費量 ( 清酒 )

 

x ;

説明変数

(

対数価格

)

y ;

被説明変数

都道府県

i

1

(

時間変化

)

都道府県

i

2

(時間変化

)

プールデータモデル

(“

Pooled”) -

価格係数”

-1.28

固定効果モデル

(“within”)

-

対象毎の変化に着目 固定効果モデル

(“within”)

-

価格係数”

-1.06

(都道府県別

DM

)

変量効果モデル

(“overall”)

-

価格係数”

-1.07

(

都道府県別誤差有

)

Referensi

Dokumen terkait

日本数学教育学会第1回春期研究大会「学会指定課題研究」 生涯学習を目指す数学教育の構築 オーガナイザー: 渡辺信(生涯学習数学研究所) 発表者: 飯高茂(学習院大学) 松本精一(財団法人日本数学検定協会) 垣花京子(筑波学院大学) 青木孝子(東海大学短期大学部) 研究題目と要約 題目:生涯学習を目指す学校教育の構築