統計学Ⅱ(河井啓希) 2022 年秋学期
8
統計学Ⅱ 第1回レポート(提出期限 2022 年 11 月 13 日 keio.jp へ)
11
月6
日までに提出した場合はレポート倍率を1
割増にしますレポート用ワークシート(rf1.xls)をダウンロードして利用しなさい。提出はpdfをkeio.jpに提出しなさい。
1
2桁コードの確認あなたの学籍番号の
6
桁目と8
桁目を書きなさい。 例)22201234なら24 2
家賃データを集めようSheet[駅リスト]であなたの 2
桁コードに対応する路線と駅名を確認し、アパートマンション賃貸情報サイト(
https://home.adpark.co.jp/chintai/tokyoto/rail/
)から担当する沿線をクリックして、駅名と間取り(1R
と
1K)をチェックして検索ボタンをクリックしてください。表示された物件情報から 20
個以上のデータを集めなさい(例えば日吉駅の場合
500
件(家賃順)あるので25(
≒500
÷20=25)
おきにデータをとり、20
個以上集める。表示件数が30(or15)なので毎 page
の最初を選ぶと楽)。指定されたデータをエクセルのsheet[1
データ20]
に入力し、各データの平均(=average
関数)
、標準偏差(=stdev
関数)
、家賃+
管理費との 相関係数(=correl 関数)についても計算したうえで、データと統計量をレポートに画像として貼り付けな さい(表をそのまま貼り付けたら減点します)。データの単位は表頭に記してあるが、所要時間は最寄り駅 の時間としなさい。結果に対する考察(日吉駅と比較して)を書きなさい。3
回帰係数、決定係数を自分で計算する家賃+管理費Yを決定する要因として専有面積をXとした回帰モデルY=α+βX+εに対するα、βの推 定量
a,b
、残差2
乗和RSS
、決定係数R2
、標準誤差s, sa, sb
を計算しなさい。計算のためにsheet[2
自分 で計算]の表を完成させ、事例と同様の表をレポートに画像として貼り付けてから(表をそのまま貼り付け たら減点します)、計算過程をレポートに記しなさい(表の作成、計算過程についてはレジュメp-4
を参考 にすること)。4
家賃モデルの推定3
の推定をエクセルの分析ツールを用いて実施したうえで、結果をsheet[3
回帰1]に[例回帰 1]に倣って貼
り付けて、事例と同様の表と図を画像として貼り付けなさい。さらに結果を以下の例に倣って整理しなさ い。Yi =
3.691
+0.1205X
i 決定係数R
20.1443
標準誤差1.233 0.06918
標準誤差s 1.300
t値
2.992 1.742
残差2乗和30.41
有効数字4
桁で統一するその上で①モデルの当てはまり(決定係数) ②Xが家賃に及ぼす効果に関するついて考察を記しなさい。
5
有意性検定家賃の決定要因Xの係数βに関してHo
:β=0 H
1:β>0
(またはβ<0)を有意水準5%で検定を行いなさ
い。6 重回帰モデルの推定
家賃
+
管理費Yを所要時間、敷金礼金、築年数、専有面積、木造、1
階を説明変数とする重回帰モデルを分 析ツールを使って推計し、結果をsheet[4
回帰2]に適宜貼り付けて、事例と同様の表を画像として貼り付
けなさい。さらに推定結果を以下の例にならって整理したうえで、考察を記しなさい。Y=5.980-0.08383
敷金礼金-0.1245所要時間-0.06829築年数+0.1545専有面積+0.4160木造-0.3581・1階(6.449) (-0.2618) (-3.442) (-4.236) (3.841) (1.033) (-1.095) R2=0.8526 RSS=5.239 ただし( )内は t
値7
重回帰モデルの改善残差
ei
の出力結果を画像で貼り付けたうえで、もっとも割安な物件について詳しく調べ、入力していない 物件情報から、安く見積もられた理由が何かを考えなさい。☆ 注 意 ☆
①レポートの採点結果は
5
段階評価しWEB
で公表します②「図として」と指定があるのに、Excelの結果をそのまま貼り付けた場合は減点します
③提出期限は厳守です。提出がない場合は秋学期の成績は
D
となります。期限後でも遅延日数に応じて減 点はしますが受け取りますので必ず提出してください。④内容が水準に達していないレポートについては再提出を命じます。
⑤優れた考察や付加的な分析に対しては高評価しますが、考察が不十分なものは低評価となります。
⑥結果を偽造して誤魔化したレポート並びに他人の成果を利用あるいは、他人に自分の成果を提供したと みなされる場合は不正行為なので大幅減点とします。
統計学Ⅱ(河井啓希) 2022 年秋学期
9
1 家賃データを集めよう(20 個以上のデータを集めてください)
(1)指定された路線をクリックして担当する駅と間取り(1R と 1K)にチェックを入れて検索
(2)Sheet[1 データ 20]の 1 行目に担当する駅名、hit した物件数を入力して、間隔を確認する 日吉駅の場合 591 件あるので、間隔は 591÷20=29.55 となるが、データ入力を容易にするため データの表示件数は 15 か 30 の見やすい方を選ぶ。日吉では 30 件おきにデータを表示した。
(3)HP で 30or15 件ごとにデータを表示して、日吉の例に倣って Sheet[1 データ 20]にデータを 入力し、各データの平均、標準偏差、変動係数、家賃+管理費との相関係数を計算し、表を図と してレポートに貼り付ける。
家賃の平均と散らばりは日吉より大きい
家賃+管理費と最も相関が強いのは専有面積と築年数、木造か否かや階数は相関が弱い 2 回帰係数、決定係数を自分で計算する
Sheet[2 自分で計算]の X に専有面積、Y に家賃+管理費をコピぺして表を完成させ、回帰係数
a,b 残差 2 乗和 決定係数 R2 標準誤差 s, sb,sa を計算(計算過程を明示すること)
回帰係数 b=75.87/361.5=.2099 a=5.967-0.2099*18.87=2.006 残差 2 乗和 25.23 決定係数 R2=1-25.23/41.15=.3869
標準誤差
s=sqrt{25.23/18}=1.184 sb=1.184/sqrt(361.5)=0.06227 sa=1.184*sqrt{7482/(20*361.5)}=1.204
駅名:日吉 物件数 708 間隔 35.4
No 家賃+管理費(万円)家賃(万円)管理費(万円)敷金+礼金(xヶ月)所要時間(徒歩x分)築年数(年)専有面積(㎡)木造(なら1、それ以外0)1階なら1所在地
1 1 3.5 3.5 0 2 5 51 18.15 1 1 横浜市港北区日吉3丁目
2 31 4.1 4 0.1 2 12 47 20.75 1 0 横浜市港北区日吉本町4丁目
3 61 4.68 4.2 0.48 0 15 34 16 0 0 川崎市中原区井田中ノ町
4 91 4.4 4.3 0.1 0 5 34 14.8 0 0 横浜市港北区下田町1丁目
5 121 4.9 4.6 0.3 0 15 28 14.85 1 0 横浜市港北区日吉3丁目
6 151 5.3 4.9 0.4 2 5 34 19.5 0 1 川崎市中原区木月3丁目
7 181 5 5 0 1 17 27 16.3 0 0 横浜市港北区箕輪町3丁目
8 211 5.3 5.2 0.1 2 16 28 18 0 0 横浜市港北区日吉本町3丁目
9 241 6 5.4 0.6 1 8 34 18 0 0 横浜市港北区日吉2丁目
10 271 5.7 5.7 0 2 10 31 17.2 1 1 川崎市中原区木月4丁目
11 301 6.1 5.8 0.3 0 17 4 13.34 1 0 川崎市中原区木月3丁目
12 331 6 6 0 0 10 44 22.68 0 0 川崎市中原区木月2丁目
13 361 6.5 6.1 0.4 2 5 29 18.27 0 0 横浜市港北区日吉本町5丁目
14 391 6.4 6.2 0.2 2 8 29 19.52 0 1 横浜市港北区日吉本町1丁目
15 421 6.55 6.2 0.35 0 13 2 11.49 1 0 川崎市幸区南加瀬4丁目
16 451 6.6 6.4 0.2 2 9 31 24 0 1 横浜市港北区日吉本町1丁目
17 481 7.2 6.7 0.5 1 6 15 20 1 1 横浜市港北区日吉4丁目
18 511 7.1 7 0.1 2 7 14 20.27 1 1 川崎市幸区南加瀬4丁目
19 541 8 7.8 0.2 2 1 7 22.71 0 0 横浜市港北区下田町4丁目
20 571 10 9.5 0.5 2 4 19 31.54 0 0 横浜市港北区日吉2丁目
平均 5.9665 5.725 0.2415 1.25 9.4 27.1 18.869 0.4 0.35 標準偏差 1.4717 1.403 0.1928 0.9105 4.8166 13.443 4.3619 0.5026 0.4894 変動係数 0.2467 0.2451 0.7985 0.7284 0.5124 0.4961 0.2312 1.2566 1.3982 家賃+管理費との相関係数 0.2371 -0.409 -0.635 0.6221 -0.184 0.0025
X Y ΔX ΔY (ΔX)^2 (ΔY)^2 ΔXΔY a+b*X e e^2 X^2
1 18.15 3.5 -0.7185 -2.4665 0.516242 6.083622 1.77218 5.8157 -2.3157 5.362467 329.4225 2 20.75 4.1 1.8815 -1.8665 3.540042 3.483822 -3.51182 6.361392 -2.26139 5.113894 430.5625 3 16 4.68 -2.8685 -1.2865 8.228292 1.655082 3.690325 5.364455 -0.68446 0.468479 256 4 14.8 4.4 -4.0685 -1.5665 16.55269 2.453922 6.373305 5.112597 -0.7126 0.507795 219.04 5 14.85 4.9 -4.0185 -1.0665 16.14834 1.137422 4.28573 5.123091 -0.22309 0.04977 220.5225 6 19.5 5.3 0.6315 -0.6665 0.398792 0.444222 -0.42089 6.09904 -0.79904 0.638465 380.25 7 16.3 5 -2.5685 -0.9665 6.597192 0.934122 2.482455 5.427419 -0.42742 0.182687 265.69 8 18 5.3 -0.8685 -0.6665 0.754292 0.444222 0.578855 5.784218 -0.48422 0.234467 324 9 18 6 -0.8685 0.0335 0.754292 0.001122 -0.02909 5.784218 0.215782 0.046562 324 10 17.2 5.7 -1.6685 -0.2665 2.783892 0.071022 0.444655 5.616313 0.083687 0.007004 295.84 11 13.34 6.1 -5.5285 0.1335 30.56431 0.017822 -0.73805 4.80617 1.29383 1.673995 177.9556 12 22.68 6 3.8115 0.0335 14.52753 0.001122 0.127685 6.766463 -0.76646 0.587466 514.3824 13 18.27 6.5 -0.5985 0.5335 0.358202 0.284622 -0.3193 5.840886 0.659114 0.434431 333.7929 14 19.52 6.4 0.6515 0.4335 0.424452 0.187922 0.282425 6.103238 0.296762 0.088068 381.0304 15 11.49 6.55 -7.3785 0.5835 54.44226 0.340472 -4.30535 4.41789 2.13211 4.545894 132.0201 16 24 6.6 5.1315 0.6335 26.33229 0.401322 3.250805 7.043507 -0.44351 0.196698 576 17 20 7.2 1.1315 1.2335 1.280292 1.521522 1.395705 6.203981 0.996019 0.992054 400 18 20.27 7.1 1.4015 1.1335 1.964202 1.284822 1.5886 6.260649 0.839351 0.70451 410.8729 19 22.71 8 3.8415 2.0335 14.75712 4.135122 7.81169 6.77276 1.22724 1.506119 515.7441 20 31.54 10 12.6715 4.0335 160.5669 16.26912 51.1105 8.626013 1.373987 1.887841 994.7716 合計 377.37 119.33 -2.1E-14 0 361.4917 41.15246 75.8704 6.22E-15 25.22867 7481.898
平均 18.8685 5.9665
b a Σe^2 R2 s sb sa
0.209881 2.006352 25.22867 0.386946 1.183889 0.062268 1.20435
統計学Ⅱ(河井啓希) 2022 年秋学期
10
3 家賃モデルの推計分析ツールを使って、回帰式「家賃=α+β 専有面積」を推定し、結果を sheet[3 回帰 1]に下記 のように貼り付けたうえで、結果を整理する。
Y
i
=2.006
+0.2099Xi
決定係数R2 0.3869
標準誤差1.204 0.06227
標準誤差s 1.184
t値 1.666 3.371 残差2乗和 25.23 有効数字
4
桁 占有面積が1m
2増えると家賃が2099
円上昇する。家賃の変化の39%を説明可能
4 仮説検定Ho:β=0, H1:β>0 帰無仮説が正しいとすると
t~t(n-2)=t(18)となる推定結果よりt=3.371となるがt(18)の右側5%臨界値は
1.734=T.INV(0.95,18)
(あるいはP値は0.1703%
<
5
%)なので、帰無仮説は棄却され、対立仮説が採択される。よって専有面積は家賃に有意な正の影響を 及ぼすといえる。5 重回帰モデルの推定
分析ツールの結果を sheet[4 回帰 2]に下記のように貼り付けて、その結果を指示通りにま とめ、考察を書きなさい
Y=4.274-0.1412 敷礼-0.02927 時間-0.07990 築年+0.2323 面積-0.2059 木造+0.02587・1 階 (5.092)(-0.8041) (-0.9734) (-9.103) (6.474) (-0.7745) (0.08599) R2=0.9234 RSS=3.153 ただし( )内は t 値
決定係数は 0.9234 なので家賃の変化の 92%はこのモデルで説明できる。
専有面積は有意に正の影響をもち、1m 2 増加すると 2323 円増える。
築年数は有意な負の影響を持つが、敷金礼金、所要時間、木造、1階は有意な影響はない。
回帰統計 分散分析表
重相関 R 0.62205 自由度 変動 分散観測された分散比有意 F
重決定 R2 0.386946 回帰 1 15.92379 15.92379 11.36121 0.003406 補正 R2 0.352888 残差 18 25.22867 1.401593
標準誤差 1.183889 合計 19 41.15246
観測数 20
係数 標準誤差 t P-値 下限 95% 上限 95%
切片 2.006352 1.20435 1.665921 0.113036 -0.52389 4.536597 専有面積(㎡)0.209881 0.062268 3.37064 0.003406 0.079062 0.340701
3 4 5 6 7 8 9 10
10 15 20 25 30
家 賃 + 管 理 費 (万 円 )
専 有 面 積(㎡)
回帰統計 分散分析表
重相関 R 0.96092 自由度 変動 分散観測された分散比有意 F
重決定 R2 0.923367 回帰 6 37.99883 6.333138 26.10671 1.56E-06 補正 R2 0.887998 残差 13 3.153626 0.242587
標準誤差 0.492531 合計 19 41.15246
観測数 20
係数 標準誤差 t P-値 下限 95% 上限 95%
切片 4.273943 0.839412 5.091595 0.000207 2.460505 6.087382 敷金+礼金(xヶ月)-0.14115 0.175531 -0.80411 0.435794 -0.52036 0.238066 所要時間(徒歩x分)-0.02927 0.030065 -0.97341 0.348116 -0.09422 0.035686 築年数(年) -0.0799 0.008778 -9.10263 5.3E-07 -0.09886 -0.06094 専有面積(㎡)0.232274 0.035875 6.474477 2.09E-05 0.15477 0.309778 木造(なら1、それ以外0)-0.20593 0.265873 -0.77454 0.452469 -0.78031 0.368455 1階なら1 0.02587 0.30085 0.085989 0.932785 -0.62408 0.675817 残差出力
観測値予測値: 家賃+管理費(万円)残差
13 5.771903 0.728097 割高 19 8.678031 -0.67803 割安