2003年度秋学期末試験 統計学Ⅱ
解答用紙には問題順に解答すること。時間配分には十分注意すること。
1 回帰分析の問題
(コメント)問題はよく読みましょう (1) 穴埋め問題(各3点)
①数値を入れるべきところに式を書いてある人、bの分散を入れるベキなのに標準誤差を 入れる人が多かった。(マイナス1点)
②「1. 残差2乗和」の出来が良くなかった (2)最小2乗法がBLUEとなる条件(5点)
①4つ正しくで5点です。2つしか書いてない人は3点、1つだけ正しい人は1点 (3)検定(10点)
① 帰無仮説と対立仮説が明示されていないor誤っている(H1:β≠0は誤りです)ものは2 点減点。
② その他おかしな記述があるものは適宜減点しています (4)より正確な推定量を得るための方策(10点)
①標本数の増加 ②Xの散らばりの確保
の2点が含まれていれていて理由が正しいものは満点。
①だけを指摘する答案が多かったですが、データ数が多くても散らばりが小さいと正確な 推定は望めません。
1 あるスーパーが広告費-売上比率X(%)の利益率Y(%)に及ぼす影響を分析するため に回帰モデル Yi=α+βXi+εi を考え、近隣のスーパー10 社のデータを集めたところ
∑
Xi =20、∑
Yi =40、∑ ( Xi − X )
2=8、∑ ( Yi − Y )
2=22、∑
(Xi −X)(Yi −Y)=12
− Y )
2=22、∑
(Xi −X)(Yi −Y)=12のような結果を得た。 1 語句 を最小化する最小2乗法にもとづくとαの推定値 a=
2数値 、βの推定値 b= 3数値 が得られるが、この最小2乗推定量はガウス=マル コフの定理よりある条件のもとで 4語句 となることが知られている。さらに残差εi
の分散σ2の推定量
s
2= 1 2
となることからbの分散は 5数値 となる。(40)(1) 文中の1~5の に適当な語句、数値を入れなさい。(15)
(2) 下線部のある条件とはどのような条件か。列挙せよ。(5)
(3) 「広告費が利益率を増やす」という仮説を有意水準5%で検定しなさい。(10)
(4) より正確な(分散の小さい)βの推定量を得るためには、どのように(X,Y)のデータ を収集すればよいか。その理由についても述べよ。(10)
2 ポアソン分布の問題
(コメント)ここで点数を稼いでる人が多くいました (1)ポアソン分布の定義(10点)
①ポアソン分布が2項分布の極限であること
②単位時間を短くとることでn→∞、p→0が成り立つ
上記2点が指摘できていれば満点、①だけなら 5 点。nを利用者数の増大とみなす答案は 部分点をあげています(小さい駅ではこうした想定は出来ないので一般的ではない)。
(2)積率母関数を利用した証明(10点)
確率変数の和X+Yの積率母関数はその積Mx(t)×My(t)に等しいことを使って証明します。
よくわからないなりに証明できた人が多かったのではないでしょか?
積率母関数の積なのに和としている人は3点だけ部分点をあげました。
(3)確率計算(10点)
よく出来ていましたが、計算間違いも多かったです(2点減点)。
λ=2としないで計算したり、Pr(X≧3)=1-{F(0)+f(1)+f(2)}とせずに f(3)をたしているもの には部分点(3点)をあげました。
3 差の有意性検定
(コメント)確率分布の基礎知識が不足してます (1)分散の均一性検定(5点)
2 2
B A
s
s ~F(49,49)に従う。授業でやりました。不出来でした。
2 駅前のA 銀行の支店には ATM(現金自動預入支払機)が2台設置されている。こ の支店では1分あたりの ATM 利用者数が平均1人であった。来年度に経営統合が予定 されているB銀行利用者のこの支店でのATM利用者数が1分あたり平均1人であるこ とが予想されている時、ATMの設置台数は十分だろうか? (30)
(1) 現在の1分あたりのATM 利用者数X は平均1のポアソン分布に従うと考えられる が、その理由を定義に基づいて簡潔に説明せよ。(10)
(2) 来年度のX は平均2のポアソン分布となることを積率母関数を用いて示しなさい。
(10)
(3) 来年度にATMが足りなくなる(1分あたり3人以上の利用者が来店する)確率はど の程度と予想されるか。(10)
※ ポアソン分布の確率関数
f(x)=e
-λλ
x/x!
、積率母関数M
x(t)=exp{λ(e
t-1)}
3 中小企業に対する政策融資の効果を検証するため、政策融資を受けた企業50社(標 本A)と受けていない企業 50 社(標本B)をランダムにえらんで雇用増加率を調べた ところAは平均xA=3%(標準偏差sA=2%)、Bは平均xB=2%(標準偏差sB=1%)
という結果を得た。(20)
(1) 2つの標本を生じさせた母集団の分散
σ
A2、σ
B2が等しいことを検定するためには、「どのような統計量がどのような分布に従う」という性質を利用すればよいか。(5) (2) 政策融資を受けた全企業と受けていない全企業の雇用増加率の母平均をそれぞれμ
A、μBとする。2つの母集団の分散が相等しく
σ
2である時、標本平均の差xA-xBは どのような確率分布に従うと考えられるか。その理由についても簡単に説明せよ。(5) (3) 調査結果から「政策融資は雇用をより増やす効果がある」という仮説を有意水準5%で検定せよ。(10)
これをまずやらないと差の有意性検定でσA=σB=σを前提とした検定が出来ません。
統計量、分布のどちらかが不完全なものは2点減点しました。
(2)平均の差の確率分布(5点)
CLTよりxA~N(μA,
σ
A2/nA)、xB~N(μB,σ
B2/nB)だからB
A x
x − ~N(μA-μB,
σ
2A/nA+σ
B2/nB)となるが、σA=σB=σの時は特にB
A x
x − ~N(μA-μB, σ2(1/nA+1/nB))となる
勝手に標準化してt=…と書いているものについては部分点3点をあげました。
(3)検定の実施(10点)
総じてよく出来ていましたが、対立仮説を明示していないor誤っているもの(H1:μA>μ B)も多く見られました。H1:μA≠μBなら2点減点、H1:xA>xB(これは仮説検定が何 たるかを理解していない)なら5点減点としました。
計算間違いも減点(-2点)としました。
4 独立性の検定(10点)
(コメント)ポイント演習そのまま。点をあげる問題です。
さすがによく出来ていました。
計算間違いは2点減点。ピアソンの適合度指標の定義の誤りは5点減点です。
4 ある病院の患者100人に喫煙習慣の有無と心臓病罹患との関係について調査したと ころ以下のような調査結果を得た。「両者の間に関連性がある」という仮説を有意水準 5%で検定せよ。(10)
心臓病 正常 計
喫煙者 35 35 70
非喫煙者 5 25 30
計 40 60 100