• Tidak ada hasil yang ditemukan

Multiple Regression Models

N/A
N/A
Protected

Academic year: 2024

Membagikan "Multiple Regression Models"

Copied!
12
0
0

Teks penuh

(1)

重回帰 (1)

Multiple Regression Models

別所俊一郎

2006

5

19

(2)

単回帰と重回帰

被説明変数に影響を与える他の要因を明示的に考慮しない

OLS

推定量はミスリーディング

不偏性・一致性を持たない

– “omitted variable bias”

計測可能な他の要因を説明変数として回帰分析に加える

単回帰の拡張

推定や検定の手続きは単回帰に似ている
(3)

単回帰の OLS 推定量の「偏り」

単回帰では、被説明変数に影響を与える説明変数以外の要因はすべて 誤差項に集約

児童数とテストの点数の例では、学校の特性/生徒の特性/地域 要因などなど

ここでは、「英語を学習中の生徒の比率」に着目

ところが、いくつかの要因を無視してしまうと

OLS

推定量は偏りを もつかもしれない

• E [ ˆ β

1

] = β

1 かもしれない

• β ˆ

1 は真の

β

1 よりも大きく(小さく)出やすい可能性

政策の効果は思ったようなものにならなくなってしまう
(4)

単回帰の OLS 推定量の「偏り」(例)

たとえば、英語を学習中の生徒の比率を無視すると、

英語を母国語としない生徒は、母国語とする生徒よりも平均的に 点数が低い

クラス児童数が多い地区には英語を母国語としない生徒が多い傾 向がある(相関係数は正)

• OLS

推定量は、クラス児童数の効果だけではなく、英語を母国 語としない生徒の比率の関係を間違って検出する(「拾ってしま う」)可能性

• β ˆ

1 は真の

β

1 よりも大きく出やすい可能性

クラスの児童数を減らしても思うような効果は出ないかもしれ
(5)

“Omitted variable bias”

説明変数が、被説明変数に影響を与え、かつ分析から外れた変数と相 関を持つとき、

OLS

推定量は不偏性を持たない

以下の

2

つの条件をともに満たすとき、

omitted variable bias

が発生

1. omitted variable

が説明変数と相関

2. omitted variable

が被説明変数に直接に影響

どちらかの条件を満たさなければ、

omitted variable bias

は発生し ない
(6)

“Omitted variable bias” (例)

1

英語を母国語としない生徒の比率

1.

クラスの人数とは相関(因果関係ではない)

2.

テストの点数とも直接相関 例

2

テストの日の曜日

1.

クラスの人数とは無相関

2.

テストの点数とは相関する可能性 例

3

一人当たりの駐車場の面積

1.

クラスの人数とは相関(因果関係ではない)

2.

テストの点数とは無相関
(7)

Omitted variable bias と OLS の仮定

OLS

3

つの仮定のうち、

E [ u

i

|X

i

] = 0

が成り立っていない

• omitted variable

が被説明変数と直接に相関している

⇐⇒

omitted variable

u

i に含まれている

• u

i

X

i が相関している

= ⇒ E [ u

i

|X

i

] = 0

したがって、

OLS

推定量は不偏性も一致性も持たない
(8)

Omitted variable bias の大きさ

いま、

corr( X

i

, u

i

) = ρ

xu とし、

OLS

推定の残りの仮定は満たされて いるとすると、

OLS

推定量は

β ˆ

1

−→

p

β

1

+ ρ

xu

σ

u

σ

X

となり、第

2

項が偏り(

bias

)の大きさを示す

• Omitted variable bias

は小標本でも大標本でも存在(不偏性も一 致性も持たない)

• Bias

の大きさは誤差項と説明変数の相関係数

ρ

xu の絶対値に依存

• Bias

の方向は誤差項と説明変数の相関係数

ρ

xu の符号に依存 単回帰による対処方法:サンプル分割
(9)

単回帰モデルを拡張し、説明変数の数を増やす

他の説明変数

X

2i

, X

3i

, ...

の値を一定に保ったときの

X

1i

Y

i の効果を推定

Population regression line

さしあたって説明変数が

2

個(

X

1i

, X

2i)のケース

線形の重回帰モデルでは、

E [ Y

i

|X

1i

= x

1

, X

2i

= x

2

]

条件付き期待値

= β

0

+ β

1

x

1

+ β

2

x

2

β

0 切片(

intercept

)、定数項(

constant

β

1

, β

2

X

1i

, X

2i の傾き、係数(

coefficient

X

1i

, X

2i 独立変数(

independent variable

)、制御変数(

control

(10)

Population multiple regression model

説明変数に入っていない決定要因を誤差項を用いて表すと、各観測値

i

に対して

Y

i

= β

0

+ β

1

X

1i

+ β

2

X

2i

+ u

i

, i = 1 , 2 , ..., n

つねに

1

をとる変数

X

0i

X

0i

= 1 ∀i

)を考えると

Y

i

= β

0

X

0i

+ β

1

X

1i

+ β

2

X

2i

+ u

i

, i = 1 , 2 , ..., n

より一般的には、

k

個の説明変数を持つモデルを

Y

i

= β

0

+ β

1

X

1i

+ β

2

X

2i

+ · · · + β

k

X

ki

+ u

i

, i = 1 , 2 , ..., n

ここで、誤差項が分散均一ならば、以下が成り立つ

var( u

i

|X

1i

, X

2i

, ..., X

ki

) = σ

u(一定で説明変数に依存しない)
(11)

重回帰モデルの OLS 推定量

単回帰モデルと同様、予測誤差の

2

乗和を最小化する推定量を考える

( β

0

, β

1

, ..., β

k

)

の推定量を一般に

( b

0

, b

1

, ..., b

k

)

とする

このとき当てはめ値は

b

0

+ b

1

X

1i

+ b

2

X

2i

+ · · · + b

k

X

ki

予測誤差は

Y

i

− ( b

0

+ b

1

X

1i

+ b

2

X

2i

+ · · · + b

k

X

ki

)

最小化すべき

2

乗和は

n

i=1

( Y

i

− b

0

− b

1

X

1i

− b

2

X

2i

− · · · − b

k

X

ki

)

2

これを最小化する

( b

0

, b

1

, ..., b

k

)

OLS

推定量といい、

( ˆ β , β ˆ , ..., β ˆ )

で表す
(12)

単回帰モデルと同じ

OLS

回帰直線

2

次元では表現できないが、

β ˆ

0

+ ˆ β

1

X

1

+ ˆ β

2

X

2

+ · · · + ˆ β

k

X

k

当てはめ値

Y ˆ

i

= ˆ β

0

+ ˆ β

1

X

1i

+ ˆ β

2

X

2i

+ · · · + ˆ β

k

X

ki

残差

u ˆ

i

= Y

i

− Y ˆ

i

= Y

i

− β ˆ

0

− β ˆ

1

X

1i

− β ˆ

2

X

2i

− · · · − β ˆ

k

X

ki

OLS

推定量

n × k

の説明変数行列

X

n × 1

の被説明変数ベクトル

y

を用いて

β ˆ = ( X

X )

1

X

y

Referensi

Dokumen terkait

  一方で立体映像は,周期的なブームは起こるが,マスメディアとして定着しない

熊本大学 数理科学総合教育センター 不偏推定量 , 一致推定量 , 最尤推定量 演習問題2 母数θの母集団からの標本をX1, X2,.. , Xn とする.ここでは統計量,推定量,推定量の不偏 性,一致性を次の意味で用いる.

熊本大学 数理科学総合教育センター 不偏推定量,一致推定量,最尤推定量 演習問題2 解答例 母数θの母集団からの標本をX1, X2,.. , Xn とする.ここでは統計量,推定量,推定量の不偏 性,一致性を次の意味で用いる.

自然に親しみ、自然とともに生きることが大切だと思える 心を育成する。 教育理念 全校一致のもと、誠実でやさしさと活力あふれる 人間を形成する。 関西商工学校の校章の一部である三角定 規を図案化した星と、大阪大倉商業学校 の校章の一部である“五階菱”を合わせた ものです。 校章 早く激しい社会変化の荒波を恐れず 自らの意思と力で進路を切り開く強さを

安定核の大きさ 核生成 幼核(embryo)生成 → 不安定核 安定核生成 【不確定性原理的】 安定核サイズは、溶解度に依存 溶解度が大きい材料の安定核サイズは大きくなる 溶解度が小さいと、サイズは小さくなる → この場合、成長できないことが多い 酸化物:水溶液への溶解度大 ⇒ 安定核のサイズは大 金属: 水溶液への溶解度小 ⇒ 安定核のサイズは小

25  105 /sを用いてよい。 (2)(1)の結果を用いて、東西風を推定せよ(単位はm/s、1の位まで)。ただし、1000hPa では東西風をゼロと仮定せよ。(1)、(2)の解答はまとめて、ひとつの表に示すこと。 3.傾圧不安定と温帯低気圧 温帯低気圧は、偏西風の蛇行に伴って、発生、発達する。このような偏西風の蛇行は、傾圧不

1 グローバルな格差拡大とわが国の状況 格差の拡大、固定化は、先進諸国においても大きな社会問題となっている。格差拡大が社 会の分断を引き起こし、社会を不安定化させるという状況もみられる。また、経済成長を低 下させるとも言われている。 世帯間の所得の格差を表わす指標であるジニ係数でみても、米国、英国を中心に上昇基調

目次 1 本日の内容・連絡事項 2 複素数の定義と基本的な性質続き 極形式 続き 極形式と偏角の例続き 演算の幾何学的解釈 和と積 合同式のおさらい? 偏角は合同式で考えよう 原点の周りの回転 n乗根 定義と極形式表示 ±1のn乗根 3 参考文献... 宿題について テストをしているつもりはないので、気軽に質問して下さい。また答えの