1
2012 年 4 月 20 日 京都大学 経済学部 藤井ゼミ TA 渡邊 誠士( M2 )
1
データの入力
◦
東証1部上場の銀行業(84
社)、輸送用機器(57
社)
平均値の仮説検定
◦
【仮説①】 輸送用機器業界では売上高は成長している。
平均の差の検定
◦
【仮説②】 輸送用機器業と銀行業では外国人持株比率が異なる。◦
【仮説③】 輸送用機器業と銀行業では企業の規模が異なる。
中央値の差の検定
◦
【仮説③】 輸送用機器業と銀行業では企業の規模が異なる。
Χ
2検定(独立の検定)
◦
【仮説④】 輸送用機器業界において、成長率が高い企業ほど臨時雇 用従業員の割合が大きい。2
File⇒New
⇒Workfile を選択
3
Unstructured /Undate d を選択
サンプルサイズ
(データ数)を入力 これが扱うデータ の最大値になりま す。
4
Quick
⇒Empty Group を選択
5
Excel
などで作っ たデータをコピー できる。最上段はデータタ イトル。(アルファ ベットのみ)
6
2
輸送用機器業界では過去5年間の売上高成長率の平均(
μ
)が0.93
%と なっている。5年間で0.93
%という値は(統計的に)成長しているというの に十分な値なのだろうか? 【仮説①】輸送用機器業界では売上高は成長している。
◦
帰無仮説H
0:μ
=0
◦
対立仮説H
1:μ≠0
7
使用するデータを 選択し、「
Show
」 ボタンをクリック「
OK
」をクリック8
「
View
」⇒
「Description Statistics
&・・・」⇒
「Simple Hypothesis Tests
」 を選択9
帰無仮説の値(今 回は
mean
が0
)を 入力し「OK
」10
Hypothesis Testing for SER02 Date: 04/20/12 Time: 12:04 Sample (adjusted): 1 57
Included observations: 56 after adjustments Test of Hypothesis: Mean = 0.000000
Sample Mean = 0.928750 Sample Std. Dev. = 3.471591
Method Value Probability
t-statistic 2.002001 0.0502
帰無仮説
データの平均・分散
有意水準 片側検定の場合は半分とし
て考えればよい。
T
値【結論】
統計的には輸送用機器業界の売り上 げは伸びているといえる。(
5
%有意)11
現在の輸送用機器業界の外国人持株比率の平均(
μ
T)は16.7
%、銀行 業の外国人持株比率の平均(μ
B)は11.8
%である。この2つは(統計的)に差があるといっていいのだろうか?
【仮説②】銀行業と輸送用機器業では外国人持株比率が異なる。
◦
帰無仮説H
0:μ
T=μ
B◦
対立仮説H
1:μ
T≠ μ
B12
3
使用するデータを 選択し、「
Show
」 ボタンをクリック「
View
」⇒
「Tests of Equality
」 を選択13
「
mean
」を選択14
Test for Equality of Means Between Series Date: 04/20/12 Time: 12:35 Sample: 1 100 Included observations: 100
Method df Value Probability
t-test 139 2.419168 0.0168
Satterthwaite-Welch t-test* 109.8072 2.360304 0.0200 Anova F-test (1, 139) 5.852374 0.0168 Welch F-test* (1, 109.8) 5.571034 0.0200
*Test allows for unequal cell variances
Std. Err.
Variable Count Mean Std. Dev. of Mean
TRANS 57 16.73105 12.73888 1.687305
BANK 84 11.81310 11.20415 1.222473
All 141 13.80121 12.04994 1.014788
15
データの平均
t
値有意水準 片側検定の場合は半分とし
て考えればよい。
【結論】
統計的には輸送用機器業界の方が外 国人持株比率は高い。(
1
%有意) 企業規模を自己資本(簿価)の額として捉えたとき輸送用機器業界の企 業と銀行業界の企業とではどちらが規模が大きいのだろうか?
輸送用機器業界の(簿価)自己資本額の平均額(
μ
T)が約5500
億円、銀行業界の(簿価)自己資本額の平均額(
μ
B)が約4100
億円。この2つ は(統計的)に差があるといっていいのだろうか? 【仮説③】輸送用機器業界と銀行業界では企業の規模(自己資本額)が 異なる。
◦
帰無仮説H
0:μ
T=μ
B◦
対立仮説H
1:μ
T≠ μ
B16
Test for Equality of Means Between Series Date: 04/20/12 Time: 12:51 Sample: 1 100 Included observations: 100
Method df Value Probability
t-test 139 0.555559 0.5794
Satterthwaite-Welch t-test* 90.42237 0.517164 0.6063 Anova F-test (1, 139) 0.308646 0.5794 Welch F-test* (1, 90.4) 0.267459 0.6063
*Test allows for unequal cell variances Std. Err.
Variable Count Mean Std. Dev. of Mean
TRANS 57 548971.7 1757068. 232729.3
BANK 84 411125.5 1190830. 129930.1
All 141 466850.5 1442304. 121463.9
17
【結論】
統計的には差は存在しない。
平均値の差には統計的に有意な差は見られなかった。ということは輸送用 機器業界と銀行業界では本当に同規模の企業といえるのか?
輸送用機器業界にはトヨタ・日産など、世界的にみても大規模な企業が存在 する。それら(外れ値)の影響を受けて「平均的」な企業がゆがめられている のでは?
◦ 対応策1:上位・下位数%のサンプルをカットしてもう一度平均差の検定を行う。
⇒上位、下位3社をサンプルからはずして検定するも有意な結果が出ず。
◦ 対応策2:中央値は一部の外れ値の影響を受けない。よって、中央値に差があるかどうかを検 定する。
【仮説③】輸送用機器業界と銀行業界では企業の規模(自己資本額)が異な る。
◦ μ
T:輸送用機器業界の自己資本総額の中央値◦ μ
B:銀行業界の自己資本総額の中央値◦
帰無仮説H
0:μ
T=μ
B◦
対立仮説H
1:μ
T≠ μ
B18
4
「
median
」を選 択19
「
View
」⇒
「Tests of Equality
」 を選択Test for Equality of Medians Between Series Date: 04/20/12 Time: 13:13 Sample: 1 100 Included observations: 100
Method df Value Probability
Wilcoxon/Mann-Whitney 2.337946 0.0194 Wilcoxon/Mann-Whitney (tie-adj.) 2.337946 0.0194
Med. Chi-square 1 3.306357 0.0690
Adj. Med. Chi-square 1 2.711716 0.0996
Kruskal-Wallis 1 5.475820 0.0192
Kruskal-Wallis (tie-adj.) 1 5.475820 0.0192
van der Waerden 1 4.735312 0.0295
> Overall
Variable Count Median Median Mean Rank Mean Score
TRANS 57 79414.00 23 61.22807 -0.216552
BANK 84 139675.5 47 77.63095 0.1469462
All 141 119009 70 71 -2.51e-17
20
Z
値有意水準
データの中央値
【結論】
統計的には銀行業界の方が企業規模 が大きい。(
5
%有意) 成長している企業は人的資本の需要が大きくなり、臨時雇用の従業員が 必要となるのでは?
【仮説④】 輸送用機器業界において、成長率が高い企業ほど臨時雇用 従業員の割合が大きい。
成長率が正である企業と負である企業に分類
(正である企業に
1
、負である企業に0
を割り振る) 臨時雇用従業員比率が業界平均より高い企業と低い企業に分類
(正である企業に
1
、負である企業に0
を割り振る) その2つの指標の独立性(相関性)を見る。
◦
帰無仮説H
0: 成長率と臨時雇用従業員比率は独立である。◦
対立仮説H
1: 成長率と臨時雇用従業員比率は相関を持つ。21 22
使用するデータを 選択し、「
Show
」 ボタンをクリック「
View
」⇒
「N-Way Tabulation
」 を選択23
「
Chi-square test
s」に チェックが入っていること を確認して「OK
」を選択Tabulation of GROWTH and LABOR Date: 04/20/12 Time: 13:44 Sample (adjusted): 1 57
Included observations: 57 after adjustments Tabulation Summary
Test Statistics df Value Prob
Pearson X2 1 0.0282880.8664
Likelihood Ratio G2 1 0.0282940.8664 LABOR
Count 0 1 Total
0 14 16 30
GROWTH 1 12 15 27
Total 26 31 57
24
【結論】
統計的には成長と臨時雇用従 業員比率の間の相関関係は見 られなかった。
Χ
2値有意水準