事例研究 ( ミクロ経済政策・問題分析 I) - 規制産業と料金・価格制度 -
(#503 –
パネルデータ分析の応用(1)) 2017
年12
月戒能一成
0. 本講の目的 ( 手法面)
- 応用データ解析の手法のうち、パネルデータ
分析の概要を理解する
(内容面 )
- 計量経済学・統計学を実戦で応用する際の 留意点を理解する
1.
パネルデータ分析とは1-1.
パネルデータ分析 (Longitudinal/Panel Data)
-
パネルデータ分析とは、複数の対象・複数の時 点に関するデータを用いた回帰分析をいう(注 ; 対象 x 時点 だけでなく、稀に 対象 x 対象
、
対象 x 対象 x 時点 などの場合あり
)
-
パネルデータ分析の利点は多数あるが、実務上下記 3 点が非常に重要
・ 試料数が限られる場合の有効な計測
← 「自由度」の確保
・ 膨大な試料からの特定の効果・影響の計測 ・ 複数対象に横断的な効果・影響の計測
異質性が存在
1. パネルデータ分析とは
1-2. パネルデータ分析の概念図
- パネルデータ分析とは、複数の対象・複数の時
点に関するデータを用いた回帰分析をいう
時間 → 0 1 ・・・ t
(制度変更) ・・・ n
(2017)
対象
↓ X1 y10 y11 ・・・ y1t (
変更) ・・・ y1n (
変更)
X2 y20 y21 ・・・ y2t (
変更) ・・・ y2n (
変更)
X3 y30 y31 ・・・ y3t ( -- ) ・・・ y3n ( -- )
X4 y40 y41 ・・・ y4t ( -- ) ・・・ y4n ( -- )
パネルデータ分析 ( 複数対象・複数時点 )
→ 外的要因変化と対象 異質性の同時除去
1. パネルデータ分析とは
1-3. パネルデータ分析と異質性
- パネルデータ分析において、対象の選択の際に なるべく異質性の少ない対象を選ぶ必要あり ・ 企業 → 業種 , 売上高 , 従業員数 ・・・
・ 家計 → 所得 , 世帯員数 , 居住地域 ・・・
- 異質性を管理せずにパネルデータ分析をしても
単なる対象別の時系列分析と比べて精度・分解
能などが向上せず利点が活かせない場合あり
- また一般の公的統計調査からパネルデータを
作成する場合、「対象主体の入れ替わり」に
よる暗黙裏の異質性に注意が必要
1.
パネルデータ分析とは1-4.
パネルデータ分析と特定化の問題
-
パネルデータ分析においては、個々の対象別の 特性をどこまでモデルに反映させるか、という モデルの特定化の問題を考える必要あり・ 固定効果モデル → 対象別の特性を識別 ・ 変量効果モデル → 対象別の特性は「誤差」
(対象別の「誤差」を別途設 定
)
・ プールモデル → 対象別の特性を無視
(時間・対象を識別しない「誤 差」
)
1.
パネルデータ分析とは1-5.
パネルデータと「欠測」
-
パネルデータ分析において「対象主体の入替り」を特段の問題としないのであれば、特定の対象 のデータの一時的な「欠測」は問題とならない
・ 対象主体の出現・消滅 (起業・廃業など
)
・ データの取得不可 (不提出・自然災害など
)
(
「アンバランスド・パネルデータ」という)
← 通常の時系列分析に対する優位性の一つ
-
特定の年度が一時的に「欠測」の場合も同様 ・ 調査の年度が連続しない場合・ 統計調査が実施されていない場合
2.
パネルデータ分析と時系列分析2-1.
時系列分析(ARMAX)
の成立条件 [復習]
-
系列相関の消滅No Serial/Auto Correlation → 系列相関が発生しないか消滅していること
-
変数の(弱 )定常性Weakly Stationary Variables
→ 変数は弱定常性条件を満たすこと(変数が単調増加・減少を続けていないこと
) -
因果一方向性No Reverse Causality
→
被説明変数(y)
から説明変数(xi)
への因果性 が存在しないこと← パネルデータ分析は系列相関対策に有効
2.
パネルデータ分析と時系列分析2-2.
パネルデータ分析と時間による系列相関
-
パネルデータ分析では、一般に計測において時間方向の系列相関が発生することは少ない → 個々の対象のデータに系列相関が存在
しても、複数の対象のデータを用いれば 系列相関は問題とならない場合が多い
-
しかし念のため系列相関の検定を掛けるべき-
つまりパネルデータ分析は「ラグ項」が存在しないことを保証している訳ではない
→ 先ず通常の時系列分析を行いラグ構造を 把握・検討すべき
(
「ダイナミックパネル分析」
)
2.
パネルデータ分析と時系列分析2-3.
パネルデータ分析での「組織」の系列相関
-
パネルデータ分析において、データを構成する対象の一部に組織関係による系列相関 (血縁・友
人関係、取引関係・資本関係などに起因した個 人・企業間の相関 )があると誤差が異常に小さく なり「偽の有意性」が出る場合有(
Moulton
効果)
-
同様に対象を何かのパラメータ順・組織順等で 周回的なデータを構築すると (擬似的な )系列相 関が現れ同様の問題を生じる場合あり← いずれもパネルデータに特徴的現象
-
対策はGLSの利用(=
計量ソフトの利用)
2.
パネルデータ分析と時系列分析2-4.
パネルデータ分析と定常性
-
パネルデータ分析においても、各変数の定常性について必ず確認が必要
→ 定常でない個々の対象のデータにつき複数 対象のデータを集めてきても、定常性の問
題
がなくなる訳ではない
-
パネルデータでの定常性検定については、ADF
検定の一種である
Fisher Type ADF
検定を適 用-
定常性検定が棄却された場合、通常のARMAX
モデル同様に階差データをとり対応する
2.
パネルデータ分析と時系列分析2-5.
パネルデータ分析と因果一方向性
-
パネルデータ分析においても、 (個別に )因果の一方向性について確認が必要
→ パネルデータ自体から因果性を判定する手 法は開発されているが未だ一般的でない
-
因果の方向性検定は各説明変数毎に被説明変 数とGranger
因果性検定を適用(Pair wise
Granger Causality Test)
-
逆方向の因果性が検出された場合、モデル構造を見直す (変数を交換する )か、パネル
VAR
モデ ルを構築; 「無意味解」「不安定解」を回避3. パネルデータ分析の手法
3-1. パネルデータ分析の「安全な」手順
[ 重要]
1)
通常の項目別時系列分析の試行a-
逆方向因果性判定(ARMAX or VAR) b- 定常性判定 (定常化処理 )
c- ラグ構造把握
2) ( 1) を与件とした )
パネルデータ分析の試行(a-
逆方向因果性 – 通常の分析と共通) b- パネル定常性判定 (定常化処理 )
c- ラグ項の選択・検討 ( 1) の結果を反映 )
d - 固定効果・変量効果などモデル選択
(e- 系列相関消滅の確認 (念のため ))
3.
パネルデータ分析の手法3-2.
パネルデータ分析の種類(1)
-
固定効果モデル(Fixed Effect Model; “Within”)
個々の対象に対応したダミー変数を説明変数
として設け、対象毎の異質性を管理した上で 「対象に横断的な変化」に着目した分析
Y(i,t) = α + X(i,t)*β
fx+ Σi DMi(1/0) + ε(i,t)
-
変量効果モデル(Random Effect Model)
対象に対応したダミー変数を設けず、対象毎
の (潜在的 )異質性を確率的現象と仮定
Y(i,t) = α + X(i,t)*β
re+ ε(i,t)
(要GLS)
3.
パネルデータ分析の手法3-3.
パネルデータ分析の種類(2)
-
ビトィーンモデル(“Between” Model)
個々の対象・時間を識別するが、説明変数に
対象の「平均値」を用いた回帰分析を行い、
対象間の異質性に着目する分析
(← 着目点が固定効果モデル
(“Within”)
の反対,
使用頻度低)
Y(i,t) = α + X average (i)*β be + ε(i,t)
-
プールモデル(Pooled Model) (
通常の回帰分析)
個々の対象・時間を識別せず、全てのデータ
が均整に相関し誤差が均一と仮定した分析
Y(i,t) = α + X(i,t) *β po + ε
3. パネルデータ分析の手法
3-4. パネルデータ分析の種類 (3)
y ;
被説明変数対象
i
1(
時間変化)
対象
i
2(時間変化
)
変量効果モデル
(“Overall”)
-
全体的変化に着目(
誤差は対象別)固定効果モデル
(“within”)
-
対象毎の変化に着目 固定効果モデル(“within”)
-
対象毎の変化に着目 ビトウィーンモデル(“Between”)
-
対象間の差異に着目プールデータモデル
-
全体的変化に着目(
誤差は均一)
3.
パネルデータ分析の手法3-5.
パネルデータ分析と検定
-
因果性検定→
Granger
因果性検定-
定常性検定 (単位根検定Unit root test) → パネル ADF
検定(Fisher Type)
-
固定効果・変量効果・プールモデル検定→
Hausman
検定
STATA
の場合; Ho:
変量効果が 正→
Breusch-Pagan
検定-
系列相関検定→ “Q”
検定, Breusch Godfrey LM
検定4. パネルデータ分析の実例
4-1. 都道府県別酒類消費量 ( 焼酎・清酒 )
(1) 作図による概況確認 (P-Q 図 , 焼酎・清 酒 )
( 出典 : 総務省家計調査報告 , 2000-2013 暦年 )
20 40 60 80 100 120
(\/100ml, ) 年平均価格 名目
2000 20042008 2012
都道府県別焼酎年平均価格 消費量推移- ( 総務省家計調査報告, 2000-2013 )
20 40 60 80 100 120
(\/100ml, ) 年平均価格 名目
20002004 2008
都道府県別清酒年平均価格 消費量推移- ( 総務省家計調査報告, 2000-2013 )
4.
パネルデータ分析の実例4-2.
都道府県別酒類消費量 (焼酎・清酒 )
(2)
因果性判定(Granger Causality Test)
(
結果省略,
各県とも有意な逆因果性なし)
(3)
単位根検定(Unit Root Test, Fisher-ADF) (
結果省略,
全て定常)
(4)
モデル仮構築(必ず固定効果モデルから開始)
ln(Qx ( i,t)) = Q
0+β
1* ln(Px(i,t)) +β
2*
ln(I(i,t))
+β
3* ln(Pz(i,t)) +Σi(β
4i*DMi) + ε(i,t)
-
数量を価格・所得・代替財価格で回帰 (対数)
(本例では結果的に所得は殆どの場合有意でない )
_cons -5.820162 1.336641 -4.35 0.000 -8.445165 -3.195159 lpses .3280074 .0917042 3.58 0.000 .1479114 .5081035 lphps 1.078908 .2781814 3.88 0.000 .5325932 1.625223 lpber 1.577454 .16328 9.66 0.000 1.256792 1.898116 lpshc -.6576098 .1216778 -5.40 0.000 -.8965703 -.4186493 lqshc Coef. Std. Err. t P>|t| [95% Conf. Interval]
corr(u_i, Xb) = 0.1415 Prob > F = 0.0000 F(4,607) = 55.15 overall = 0.2343 max = 14 between = 0.3117 avg = 14.0 R-sq: within = 0.2666 Obs per group: min = 14 Group variable: kid Number of groups = 47 Fixed-effects (within) regression Number of obs = 658 . xtreg lqshc lpshc lpber lphps lpses, fe
4. パネルデータ分析の実例
4-3. 都道府県別酒類消費量 ( 焼酎 )
(5a) 固定効果モデル推計 (Fixed Effect -)
焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数)
定数項
sigma_e .24976559 sigma_u .21936878
_cons -5.893854 1.336897 -4.41 0.000 -8.514124 -3.273585 lpses .3588952 .0914573 3.92 0.000 .1796421 .5381482 lphps 1.08973 .2778987 3.92 0.000 .5450585 1.634401 lpber 1.625368 .1622299 10.02 0.000 1.307404 1.943333 lpshc -.7577282 .1160189 -6.53 0.000 -.9851211 -.5303353 lqshc Coef. Std. Err. z P>|z| [95% Conf. Interval]
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 Wald chi2(4) = 230.97 overall = 0.2445 max = 14 between = 0.3212 avg = 14.0 R-sq: within = 0.2658 Obs per group: min = 14 Group variable: kid Number of groups = 47 Random-effects GLS regression Number of obs = 658 . xtreg lqshc lpshc lpber lphps lpses, re
4. パネルデータ分析の実例
4-4. 都道府県別酒類消費量 ( 焼酎 )
(6a) 変量効果モデル推計 (Random Effect -)
焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数)
定数項
4. パネルデータ分析の実例
4-5. 都道府県別酒類消費量 ( 焼酎 )
(7a) Hausman 検定 ; モデル係数間の有意 差検定
(V_b-V_B is not positive definite) Prob>chi2 = 0.0000
= 79.39
chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B) Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg b = consistent under Ho and Ha; obtained from xtreg lpses .3280074 .3588952 -.0308877 .0067247
lphps 1.078908 1.08973 -.0108218 .0125388 lpber 1.577454 1.625368 -.0479144 .0184887 lpshc -.6576098 -.7577282 .1001184 .0366754
SHCFX . Difference S.E.
(b) (B) (b-B) sqrt(diag(V_b-V_B)) Coefficients
. hausman SHCFX 固定効果 変量効果
「係数に差がない」
帰無仮説を棄却 (→ 固定効果)
4. パネルデータ分析の実例
4-6. 都道府県別酒類消費量 ( 焼酎 )
(8a) プールモデル推計 (Pooled -)
焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数)
定数項
Variables: fitted values of lqshc Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest
_cons -6.729215 1.691285 -3.98 0.000 -10.05023 -3.408201 lpses .6314143 .1127055 5.60 0.000 .4101054 .8527232 lphps 1.184626 .3476947 3.41 0.001 .501892 1.867361 lpber 1.797425 .2027111 8.87 0.000 1.399381 2.195469 lpshc -1.228279 .1085202 -11.32 0.000 -1.441369 -1.015188 lqshc Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 101.488848 657 .154473132 Root MSE = .33838 Adj R-squared = 0.2587 Residual 74.7710575 653 .114503916 R-squared = 0.2633 Model 26.7177902 4 6.67944754 Prob > F = 0.0000 F( 4, 653) = 58.33 Source SS df MS Number of obs = 658 . reg lqshc lpshc lpber lphps lpses
4. パネルデータ分析の実例
4-6. 都道府県別酒類消費量 ( 焼酎 )
(9a) 変量・プール検定 ( Breusch-Pagan 検 定)
Prob > chibar2 = 0.0000 chibar2(01) = 780.08 Test: Var(u) = 0
u .0481227 .2193688 e .0623829 .2497656 lqshc .1544731 .3930307 Var sd = sqrt(Var) Estimated results:
lqshc[kid,t] = Xb + u[kid] + e[kid,t]
Breusch and Pagan Lagrangian multiplier test for random effects . xttest0
「県別誤差の分散 0」 帰無仮説を棄却
(→ 変量効果) 但し先のHausman
検定の結果から 固定効果モデルが適
4. パネルデータ分析の実例
4-7. 都道府県別酒類消費量 ( 焼酎 )
x ;
説明変数(
対数価格)
y ;
被説明変数都道府県
i
1(
時間変化)
都道府県
i
2(時間変化
)
プールデータモデル
(“
Pooled”) -
“価格係数”-1.23
固定効果モデル
(“within”)
-
対象毎の変化に着目 固定効果モデル(“within”)
-
“価格係数”-0.66
(都道府県別
DM
有)
変量効果モデル
(“overall”)
-
“価格係数”-0.76
(
都道府県別誤差有)
4. パネルデータ分析の実例
4-8. 都道府県別酒類消費量 ( 清酒 )
(5b) 固定効果モデル推計 (Fixed Effect -)
清酒価格(対数) ビール価格(対数) 発泡酒価格(対数) 焼酎価格(対数)
定数項 _cons 23.26638 1.520089 15.31 0.000 20.2811 26.25165 lpshc -.5108565 .1383775 -3.69 0.000 -.7826132 -.2390999 lphps -.7384788 .3163605 -2.33 0.020 -1.359773 -.1171848 lpber -.4940239 .1856895 -2.66 0.008 -.8586957 -.1293522 lpses -1.059136 .1042902 -10.16 0.000 -1.263949 -.8543224 lqses Coef. Std. Err. t P>|t| [95% Conf. Interval]
corr(u_i, Xb) = 0.0448 Prob > F = 0.0000 F(4,607) = 60.30 overall = 0.1890 max = 14 between = 0.1221 avg = 14.0 R-sq: within = 0.2844 Obs per group: min = 14 Group variable: kid Number of groups = 47 Fixed-effects (within) regression Number of obs = 658 . xtreg lqses lpses lpber lphps lpshc, fe
4. パネルデータ分析の実例
4-9. 都道府県別酒類消費量 ( 清酒 )
(6b) 変量効果モデル推計 (Random Effect -)
rho .60077246 (fraction of variance due to u_i) sigma_e .28404474
sigma_u .34844281
_cons 23.38788 1.514316 15.44 0.000 20.41987 26.35588 lpshc -.4932498 .1342173 -3.68 0.000 -.7563109 -.2301887 lphps -.7540022 .3148291 -2.39 0.017 -1.371056 -.1369484 lpber -.5024006 .1842086 -2.73 0.006 -.8634427 -.1413584 lpses -1.071173 .1036915 -10.33 0.000 -1.274404 -.8679409 lqses Coef. Std. Err. z P>|z| [95% Conf. Interval]
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 Wald chi2(4) = 247.49 overall = 0.1896 max = 14 between = 0.1241 avg = 14.0 R-sq: within = 0.2843 Obs per group: min = 14 Group variable: kid Number of groups = 47 Random-effects GLS regression Number of obs = 658 . xtreg lqses lpses lpber lphps lpshc, re
清酒価格(対数) ビール価格(対数) 発泡酒価格(対数) 焼酎価格(対数)
定数項
4. パネルデータ分析の実例
4-10. 都道府県別酒類消費量 ( 清酒 )
(7b) Hausman 検定 ; モデル係数間の有意 差検定
固定効果 変量効果
「係数に差がない」
帰無仮説を保留 (→ 変量効果) Prob>chi2 = 0.7340
= 2.01
chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B) Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg b = consistent under Ho and Ha; obtained from xtreg lpshc -.5108565 -.4932498 -.0176067 .0336754
lphps -.7384788 -.7540022 .0155234 .03109 lpber -.4940239 -.5024006 .0083766 .0234046 lpses -1.059136 -1.071173 .0120368 .0111583
SECFX . Difference S.E.
(b) (B) (b-B) sqrt(diag(V_b-V_B)) Coefficients
. hausman SECFX
4. パネルデータ分析の実例
4-11. 都道府県別酒類消費量 ( 清酒 )
(8b) プールモデル推計 (Pooled -)
清酒価格(対数) ビール価格(対数)
発泡酒価格 lphps -1.016505 .4377506 -2.32 0.021 -1.876074 -.1569368 lpber -.5914338 .2673031 -2.21 0.027 -1.116311 -.0665565 lpses -1.275343 .1731425 -7.37 0.000 -1.615326 -.9353593 lqses Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust (対数)
Root MSE = .44287 R-squared = 0.1932 Prob > F = 0.0000 F( 4, 653) = 33.51 Linear regression Number of obs = 658 . reg lqses lpses lpber lphps lpshc, robust
Prob > chi2 = 0.0001 chi2(1) = 14.73
Variables: fitted values of lqses Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest
4. パネルデータ分析の実例
4-12. 都道府県別酒類消費量 ( 清酒 )
(9b) 変量・プール検定 ( Breusch-Pagan 検 定)
「県別誤差の分散 0」 帰無仮説を棄却
(→ 変量効果) 先のHausman検定
の結果と併せて 変量効果モデルが適 Prob > chibar2 = 0.0000
chibar2(01) = 1454.93 Test: Var(u) = 0
u .1214124 .3484428 e .0806814 .2840447 lqses .2416111 .4915396 Var sd = sqrt(Var) Estimated results:
lqses[kid,t] = Xb + u[kid] + e[kid,t]
Breusch and Pagan Lagrangian multiplier test for random effects . xttest0
4. パネルデータ分析の実例
4-13. 都道府県別酒類消費量 ( 清酒 )
x ;
説明変数(
対数価格)
y ;
被説明変数都道府県
i
1(
時間変化)
都道府県
i
2(時間変化
)
プールデータモデル
(“
Pooled”) -
“価格係数”-1.28
固定効果モデル
(“within”)
-
対象毎の変化に着目 固定効果モデル(“within”)
-
“価格係数”-1.06
(都道府県別