事例研究 ( ミクロ経済政策・問題分析 I) - 規制産業と料金・価格制度 -
(#301 – 試料収集と誤差対策 )
2017 年 12 月
戒能一成
0. 本講の目的 ( 手法面)
-
分析・計測時の誤差に対する典型的な対策手 法を理解する
- 特に事前措置(試料整備)と事後措置(感度 分
析)の組合せによる問題解決手法を理解する
(内容面)
- 計量経済学・統計学を実戦で応用する際の 基礎的留意点を理解する
1.
削減困難な誤差・削減可能な誤差1-1.
誤差の分類
-
一般に社会科学分野のデータを分析・計測する場 合において一定程度の誤差は不可避である
-
一方、なるべく誤差を削減するための対策は十分 でないことが多い (← 減らせる「誤差」がある)○ 本質的に削減困難な誤差
-
偶発的要因の影響(
自然現象・社会現 象)
-
考慮外の要因の影響(
未知の事象)
○ 削減可能な誤差
-
試料の収集・分類時での問題の影響
-
分析モデル上の問題の影響(
~”偏差”)
3
1.
削減困難な誤差・削減可能な誤差1-2.
誤差と偏差 ; → 偏差は「存在が許されない」
誤差 (不可避 ) 誤差
(Error)
~ 精度(Precision)
偏差
(
要回避)
高誤差High ← → Low
低誤差 偏差 高偏差(Bias)
High
~ ↑
正確度 ↓
(Accuracy)
Low
低偏差
1.
削減困難な誤差・削減可能な誤差1-3.
事前対策・事後対策
-
削減可能な誤差に対する対策には事前対策・事後 対策がある事前対策
:
測定・分析する試料を準備する段階→ 試料属性の分別、試料数の確保 → モデルの検討、複眼的探索の実
施
事後対策
:
測定・分析を実施した後の段階→ 検算・検定、感度分析の実施
-
事前・事後の対策を直線的に適用するだけでは不 十分であり、可能な限り両者を組合わせて再帰的に 対策を実施していくことが有効である5
1. 削減困難な誤差・削減可能な誤差
1-4. 削減可能誤差への「再帰的」対策
- 事前対策・事後対策の「再帰的」組合せの例
( → 「予察」による再帰的対策の重要性 ; 冗長 性 )
事前対策 : 試料数の確保
分析・計測
事後対策 : 感度分析
結果判定
「再」事前対策
モデル構造見直し
(
再計 測)
試料属性見直し
(
再採取)
2.
事前対策(1)
試料整備2-1.
「試料整備」は「追加整備(=
やり直し)
」を前提に
-
事前対策として理想的な試料整備は、後の分析・計測で使用する可能性がある試料を悉皆的・網羅的 に整備しておくこと
-
一方で時間的・予算的制約の観点からは、必要最 小限の試料整備で済ませることが必要特に実務上は当該制約は非常に厳しい
→ 「最適な試料整備」を 1 回の試行で達成する ことは不可能であり、「後で 2 回目以降の追
加
整備」を行う可能性を考慮に入れておくこと
7
2.
事前対策(1)
試料整備2-2.
試料整備の手法:
「着眼大局・着手小局」
-
出典元・形態の記録 (どこから持ってきたか?)
・ 発行者・年・資料名・刊 /編・ページ,
入手日時-
分類情報の把握・記録・ 入手可能年 (何年 (度 )から入手可能か
?)
・ 原分類項目 (地域・属性などの分類は ? )企業
:
業種・規模 (売上 ,従業員数)
家計:
地域・所得階層・世代層・ 改訂経過 (毎年度改訂 ?
5 年毎
?)
→ 最初「枠」 ( 表頭・表側 ) と合計値だけ整備してお く
2.
事前対策(1)
試料整備2-3.
精度と信頼区間: CI Confidence Interval
-
危険率 5 %での t検定の考え方を拡張して、逆に
回帰係数 β
*k
が信頼できる確率95
%の範囲(=
β
*k
との差が0
と言える確率が片側2.5
%以上の範囲が「信頼区間
CI
」-
β*k(±5 % ) = β *k
± t( 0.025)
*( σ *2
・(x’x) -1kk ) 0.5
t
検定統計値9
d (
帰無仮説が真である)
確率密度, t
分布0 (= t
0.500)
β*
k: △ β*
k=0
t
(0.025)△ β*
k(±5%)= t
(0.025)* ( σ
*2・ (x’x)
-1kk)
0.5
確率密度積分値
(=
確率)
片側2.5%
t (n-k)
2.
事前対策(1)
試料整備2-4.
試料数と信頼区間
-
試料数と信頼区間 (危険率 5% ,
分散既知)
n ≧(2 * t (0.05, n-1) ) 2 /CI 2
*σ
2 ⇔CI ≦ 2 * t (0.05, n-1 )
* σ / n0.5
~
CI α n -0.5
( n > 10 )
n :
試料数, CI :
信頼区間, σ
2:
分散 → 信頼区間が1/2
になる迄精度を上げるために は試料数を 4 倍に増やす必要あり( ! )
→ しかし、社会科学分野では試料数を増加させ ることは非常に困難、分析上の「隘路」
2.
事前対策(1)
試料整備2-5.
単に試料数を増やせばよい訳ではない
-
社会科学分野での分析・計測精度上の問題は 「均質な」試料を増やす必要があること
-
試料を過去何十年に遡って集めたり、大量の 対象に調査を掛けたとしても、均質性が上が る保証はなく却って精度が下がる場合あり-
手堅い対応は年 (年度 )資料を月次資料による分析に置換えること (精度約
3.4 倍 )
→ 近年公的統計の「個票データ」利用による分析 ・計測が多用される理由の 1 つ
11
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
t ( = 検定値 Z の臨界値 )
両側検定 片側検定
p=0.05 t の 分布表
2.
事前対策(1)
試料整備2-6.
現実的目安 [重要]
-
試料数が10
以上かつ自由度が 5 以上になるよう 措置しておけば一定の精度が確保可能(
例:
主説明変数2,
月次の重回帰なら18
試料)
-
それ未満の場合自由度の低下に伴い精度急減
CI ≦ 2 * t (α,n-1 )
* σ/ n0.5
→t が n < 5
で急増
⇔
CI
がn < 5
で急 拡大
(t (0.05,∞ ) = 1.96)
3.
事前対策(2)
モデル検討3-1.
モデル選択の現実的問題
-
一般に社会科学分野で多様されるモデルは、複数の説明変数による線形・対数線形モデル
-
特に政策の評価・分析を行う際には、殆どの場合 時系列 ( 線形・対数線形 ) モデルを解くこととなる (→ ARMAX(Box-Jenkins),VAR
又はパネルデータ)
-
従って「如何に妥当な被説明変数・説明変数の組合せを用いて分析・計測したか」
という点が問題
→ ミクロ経済理論と計量分析の接点
13
3. 事前対策 (2) モデル検討
3-2.
企業モデル(1) 基本的手法
-
企業モデルにおいて重要な点は「供給曲線」に 関する情報の識別- 多くの場合、財務諸表から平均費用・限界費用 を推計することとなる (← 年度 , 一部四半期 ) -
平均費用の推計は容易であるが、限界費用を推計することは困難であり、通常は可変費で代用
-
費用項目別の固定費・可変費の区別は業種により異なるため、最終的には作図や簡単な回帰分析 で可変費か否かを確定させることとなる
(
生産量変化に応じた当該費目の変化が正相 関?)
3. 事前対策 (2) モデル検討
3-3. 企業モデル (2) 可変費に関する問題
- 費用項目別の可変費からの限界費用の推計に おいては「外的要因の除去」が必要
( 例 : 燃料・原料費 ( 物価・為替 ), 人件費 ( 賃 金 ))
- 可変費から限界費用を推計する場合、曲線形 状の仮定が分析・試算の精度に影響を与える
( 例 : 固定値 (定数 ), 一次 (直線 ), 二次 , 片対数 , ・・・ )
15
P,C
価格・費用Q
数量x
x x
x
3.
事前対策(2)
モデル検討3-4.
家計モデル(1)
基本的手法
- 家計モデルにおいて重要な点は「需要曲線」に関す る情報の識別 (多くは同時均衡
)
-
多くの場合、世帯別家計消費支出から価格弾力性 など需要曲線に関する分析・計測を実施→ 総務省「家計調査報告」 (月報 )の有用性
-
世帯別家計消費支出の分析においては、通常は価 格弾力性・所得弾力性を時系列分析により推計
Q x = e x
* Px + e -x * P -x + e i
* I + [Lag] +[error]
x; 当該財サービス – x; 代替財サービス
Q;
数量P;
価格I;
所得 (全て対数)
3.
事前対策(2)
モデル検討3-4.
家計モデル(2)
試料の均質性の問題
- 家計モデルにおける分析・計測で明確な弾力性が 観察されない場合、分析・計測対象となる試料の属性 を識別して分析・計測してみることが有効
( =
試料の属性別「不均質性」を疑う価値あり)
→ 地 域(10
地域・47
県庁所在地)
→ 所得階層(5
分位 (嘗ては10
分位))
→
世代層 (世帯主10
歳刻 (嘗ては 5 歳 刻))
(
例 ) 飲食費・交通通信費・娯楽費 (← 地域・所得)
教育費・医療費 (← 世代 層・所得
)
17
4. 事後対策 – 感度分析
4-1. 感度分析の目的・手法
- 分析・計測実施後に、分析・計測結果に対して問
題とする「計測値」の精度が与える影響を確認することが感度分析の目的
- 感度分析は通常「信頼区間の上限・下限」を用いて
実施する (
例: 95
%信頼区間CI 上限・下限 )
← 通常起こりえる当該「計測値」の変動に対し 分析・計測 結果がどの程度変化するかを確認
- 問題となるのは、「信頼区間の上限・下限」による
感度分析の結果、分析・計測結果が覆る場合
→ 事前対策に戻り「再帰的対策」を試行すべき
4.
事後対策 – 感度分析4-2.
「再帰的対策」を講じてもなお不安定な場合
- 十分に「再帰的対策」を講じてもなお、「信頼区間 の上限・下限」を用いた感度分析の結果、分析・計測結 果が覆る場合には、「誤差」の問題ではなく「本質的不 安定性」が原因である場合あり
→ (例
)
一時的流行(ex
健康食品・化 粧品)
災害・自然現象
(ex
東日本大震災)
画期的新製品普及(ex
スマホ)
-
この場合においては、「結果が不安定である」という点自体が重要な帰結の一部であり、何故不安定な のかを究明するよう方針転換するのも一案
19
4. 事後対策 – 感度分析
4-3. 当該「数値」の精度情報が得られない場合
-
先験的・演繹的に設定された数値の場合、信頼区間など精度に関する情報が得られないことがある (
例)
海外の事例、先行研究事例-
その場合「通常起こりえる当該「数値」の範囲」を推計し分析・計測結果がどの程度変化するか確認 ← (
例)
過去最大値・最小値の差の25
%該当値の ± 10
%, ±20
%or
±25
%- やむを得ない場合を除き、分析・計測上重要な
「数値」を先験的・演繹的に設定することは避けるべ き
5. 実践的事例 – 「酒類の価格と消費」
5-1. 酒類の価格と消費 ( 事例状況説明 )
- 例 : 酒類消費量 ( 家計調・県庁所在地別・
2008)
横断面分析 n=47 ( 日本の都道府県数 )
21
t値・
p
値F検定結果
R
2・Adj.R
2 二乗和・k, n-k
・平均二乗和
残差平方和 推計式説明
分・残差分
5. 実践的事例 – 「酒類の価格と消費」
5-2. 事例 1 - 焼酎の価格効果 (1)
- 焼酎購入量 ( 家計調・県庁所在地別・ 2008) lsaq: 消費量 ( 対数 , l ) lsap: 価格 ( 対
数 , \/ l )
lexp: 消費支出 ( 対数 ) lpdp: 人口密度 ( 対 数 )
lbeep: ビール価格 ( 対数 ) ; STATA 計測結果
lpdp -.1476392 .0525584 -2.81 0.008 -.2537063 -.041572 lexp -.7018367 .4758033 -1.48 0.148 -1.662047 .2583733 lbeep 3.232778 1.085017 2.98 0.005 1.043126 5.42243 lsap -1.452444 .32794 -4.43 0.000 -2.114253 -.7906338 lsaq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 5.16806938 46 .112349334 Root MSE = .24769
Adj R-squared = 0.4539
Residual 2.5767747 42 .061351779 R-squared = 0.5014
Model 2.59129468 4 .647823671 Prob > F = 0.0000
F( 4, 42) = 10.56
Source SS df MS Number of obs = 47
. reg lsaq lsap lbeep lexp lpdp
_cons .0037443 9.692547 0.00 1.000 -19.55661 19.5641 lpdp -.1476392 .0525584 -2.81 0.008 -.2537063 -.041572 lexp -.7018367 .4758033 -1.48 0.148 -1.662047 .2583733 lbeep 3.232778 1.085017 2.98 0.005 1.043126 5.42243 lsap -1.452444 .32794 -4.43 0.000 -2.114253 -.7906338 lsaq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 5.16806938 46 .112349334 Root MSE = .24769 Adj R-squared = 0.4539 Residual 2.5767747 42 .061351779 R-squared = 0.5014 Model 2.59129468 4 .647823671 Prob > F = 0.0000 F( 4, 42) = 10.56 Source SS df MS Number of obs = 47 . reg lsaq lsap lbeep lexp lpdp
5. 実践的事例 – 「酒類の価格と消費」
5-3. 事例 1 - 焼酎の価格効果 (2)
- 焼酎の価格弾力性( lsap 係数 ) は -1.452,
95 %信頼区間の上限・下限は -0.791, -2.114
→ 変動は ± 0.66
( 例 ) 酒税を 10 %引上げ → 需要は△ 8 ~
△ 21 %
23
βi (
係数) 95%
信頼区間上限・下限23
5.
実践的事例 – 「酒類の価格と消費」5-4.
事例 1-
焼酎の価格効果;
精度向上対策検討
-
量的対応:
試料数の増加
-
月報・複数年度利用によるパネルデータ化(但し 月次・年次変動など時系列変動注意 )
- 質的対応
:
属性区分による対応
-
地域・所得・世代層区分によるデータ分割 (但し 多層に区分すると試料数は急減)
-
複合的対応
- 例 :
月報利用&
地域区分化,
但し試行錯誤要 →1)
質的対応, 2)
量的対応 の順に試行すべき
25
5. 実践的事例 – 「酒類の価格と消費」
5-5. 事例 1 - 試料数を無作為に減らした影響
・ 24( 奇数県 ) CI ~ ± 1.0 ( 精度低下 )
・ 23( 偶数県 ) CI ~ ± 1.0 ( 精度低下 )
_cons -5.338253 12.5334 -0.43 0.675 -31.57096 20.89446 lpdp -.1711668 .0705118 -2.43 0.025 -.3187498 -.0235838 lbep 3.057913 1.428668 2.14 0.046 .067676 6.04815 lexp -.2529548 .6417604 -0.39 0.698 -1.596175 1.090265 lsap -1.024395 .4819226 -2.13 0.047 -2.03307 -.0157192 lsaq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 2.66376298 23 .115815782 Root MSE = .26253 Adj R-squared = 0.4049 Residual 1.30954389 19 .068923363 R-squared = 0.5084 Model 1.35421909 4 .338554772 Prob > F = 0.0069 F( 4, 19) = 4.91 Source SS df MS Number of obs = 24 reg lsaq lsap lexp lbep lpdp
. (5 vars, 24 obs pasted into editor)
_cons 11.5556 17.05605 0.68 0.507 -24.27784 47.38904 lpdp -.1262372 .0932673 -1.35 0.193 -.3221845 .0697102 lbep 2.799773 1.986667 1.41 0.176 -1.37406 6.973605 lexp -1.306458 .7733931 -1.69 0.108 -2.931297 .3183805 lsap -1.838581 .4883224 -3.77 0.001 -2.864509 -.8126541 lsaq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 2.39866289 22 .109030132 Root MSE = .24392 Adj R-squared = 0.4543 Residual 1.07092205 18 .059495669 R-squared = 0.5535 Model 1.32774085 4 .331935212 Prob > F = 0.0042 F( 4, 18) = 5.58 Source SS df MS Number of obs = 23 reg lsaq lsap lexp lbep lpdp
. (5 vars, 23 obs pasted into editor)
5. 実践的事例 – 「酒類の価格と消費」
5-6. 事例 1 - 試料を属性区分した影響 ( 試料数
1/2)
・ 東日本 (24) CI ~ ± 0.8
(精度向上 )
・ 西日本 (23) CI ~ ± 1.4 ( 有意性消滅 )
_cons 6.640061 15.35801 0.43 0.670 -25.50462 38.78474 lpdp -.0626354 .0597867 -1.05 0.308 -.1877704 .0624995 lbep 2.595993 1.848456 1.40 0.176 -1.27287 6.464857 lexp -.9195582 .7447469 -1.23 0.232 -2.478331 .6392149 lsap -1.585569 .3738825 -4.24 0.000 -2.368114 -.8030238 lsaq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 2.53493653 23 .110214632 Root MSE = .22802 Adj R-squared = 0.5282 Residual .987903226 19 .051994907 R-squared = 0.6103 Model 1.5470333 4 .386758325 Prob > F = 0.0009 F( 4, 19) = 7.44 Source SS df MS Number of obs = 24 reg lsaq lsap lexp lbep lpdp
. (5 vars, 24 obs pasted into editor)
lbep 3.121579 1.529034 2.04 0.056 -.0908034 6.333961 lexp -.5742994 .6977093 -0.82 0.421 -2.040132 .8915334 lsap -1.410083 .6903079 -2.04 0.056 -2.860366 .0401998 lsaq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 2.63127346 22 .119603339 Root MSE = .26523 Adj R-squared = 0.4118 Residual 1.26628196 18 .070348998 R-squared = 0.5188 Model 1.3649915 4 .341247875 Prob > F = 0.0078 F( 4, 18) = 4.85 Source SS df MS Number of obs = 23 reg lsaq lsap lexp lbep lpdp
5. 実践的事例 – 「酒類の価格と消費」
5-7. 事例 2 – 清酒の価格効果
- 「 95 %有意でない」係数の意味
- 清酒の価格弾力性( lsesp 係数 ) は -0.760,
95 %信頼区間の上限・下限は +0.171, -1.692
→ 変動は ± 0.93 だが 符号反転
→ 試料の再探索・モデルの再構築が必要
27
_cons -36.86758 39.2541 -0.94 0.353 -116.0856 42.35041 lpdp -.0551439 .0656767 -0.84 0.406 -.1876848 .0773971 lbep .9660747 3.174408 0.30 0.762 -5.440141 7.37229 lexp 2.647922 1.460407 1.81 0.077 -.2992983 5.595142 lsesp -.7603808 .4615664 -1.65 0.107 -1.69186 .171098 lsesq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust
Root MSE = .50057 R-squared = 0.1801 Prob > F = 0.0157 F( 4, 42) = 3.46 Linear regression Number of obs = 47 reg lsesq lsesp lexp lbep lpdp, robust