2.3 標準正規分布から導かれる分布 【動画】
この後検定について話を始めますが、そのとき出てくる分布の名前はχ2分布、F分布、t 分布の 3 つです。下にそれぞれの確率密度関数の形や定義式などを書いてありますが、そ の部分はほとんど知らなくても結構です。ただこれらの分布が標準正規分布を基礎にして いることとそれぞれの分布に自由度と呼ばれる整数のパラメータがあって、その値によっ て確率密度関数の形が変わるということは記憶しておいて下さい。各分布の自由度の数は、
χ2分布で1つ、F分布で2つ、t分布では1つです。またこれらの分布は自由度を下に付け て以下の略号で表されます。
χ2分布:
n2, F分布:2 1,n
Fn , t分布:
t
n覚えるのは分布の名前とこれらが正規分布と関係するということだけで結構です。
χ2分布(カイ2乗)
) 1 , 0 (
~ N
X
i 分布で独立なとき、2 1
2
2
~
nn i
X
i
=
=
分布(自由度nの
2分布)F分布
2 2 1
~
n1
分布, 22 2~
n2
分布で独立なとき、2 1, 2 2 2
1 2
1
~ F
n nn F n
=
分布(自由度n1, n2のF分布)
t分布
) 1 , 0 (
~
NX 分布,
2~
n2分布で独立なとき、tn
n
t X
~
2= 分布(自由度nのt分布)
注)
t
2~ F
1,n分布注)
n →
でN( 0 , 1 )
分布0 1 2 3 4 5
0.2 0.4
n=1
n=2
n=3
n=4
0.5
1 2 3 4 5
0 1
2,4 8,16 4,8
8,4
-2
0.2
-4 0 2 4
0.4 n=4
n=2 n=1
が表示されます。
図2.3.2 検定値と確率画面
例えば試験成績の分布で
N ( 65 , 8
2)
の場合、x 74
の確率を求めるには、正規分布の平 均と分散(または標準偏差)の値を、分布名の横の値のところに170を書き込み、「→」ボ タンをクリックすると以下のように上側確率と両側確率が表示されます。逆に上側確率か 両側確率かを書き込み、「←」ボタンをクリックすると平均値より大きい側の検定値が表示 されます。図2.3.3 正規分布と検定確率
同様にχ2分布についても、検定値と自由度を書き込んで「→」ボタンをクリックすると 上側確率が、逆に上側確率を書き込んで「←」ボタンをクリックすると検定値が表示され ます。F分布やt分布についても同じです。
ここで上側確率と両側確率については正規分布を例に取ると以下のようになります。
図2.3.4 上側確率と両側確率
正規分布から導かれる分布の密度関数を描くには、メニュー[分析-基本統計-正規分布 と確率-密度関数グラフ]を選択します。以下が実行画面です。
図2.3.5 密度関数グラフ
ここではまず軸の設定を行います。慣れるまでは x 軸の設定がうまく行かないと思います が、何度か試すと慣れてきます。特に問題を解く際には、結果のグラフの軸を参考にして 下さい。描画は、分布を選択し、自由度などを与えた後、「グラフ描画」をクリックします。
問題1 以下の値を求めよ。
1)N
( 0 , 1 )
分布,x値1.5のときの上側確率 p/2 [ ] 2)N( 0 , 1 )
分布,x値1.5のときの両側確率 p [ ] 3)N( 170 , 64 )
分布,x値180のときの上側確率 p/2 [ ] 4)
52分布,
2値10のときの上側確率 p [ ] 5)
102 分布,上側確率0.05のときの
2値 [ ] 6)F8,4分布,F値10のときの上側確率 p [ ] 7)F 分布,上側確率0.05のときのF値 [ ]両側確率 上側確率
問題2 以下のグラフを描け。
1)N
( 0 , 1 )
分布 2)自由度4のχ2分布
3)自由度8,4のF分布 4)自由度1のt分布
解答1
1)N
( 0 , 1 )
分布,x値1.5のときの上側確率 p/2 [0.06681]2)N
( 0 , 1 )
分布,x値1.5のときの両側確率 p [0.13361]3)N
( 170 , 64 )
分布,x値180のときの上側確率 p/2 [0.10565]4)
52分布,
2値10のときの上側確率 p [0.07524]5)
102 分布,上側確率0.05のときの
2値 [18.02059]6)F8,4分布,F値10のときの上側確率 p [0.02059]
7)F10,5分布,上側確率0.05のときのF値 [4.73506]
8)t10分布,
t
値2のときの上側確率p/2
[0.03669]9)t10分布,
t
値2のときの両側確率p
[0.07339]10)t10分布,両側確率0.05のときの
t
値 [2.22814]解答2 省略
2.4 検定の基礎
統計では調査したい対象を母集団と言います。しかし、例えば広島県の成人などとした 場合、調査の費用は莫大かかりますので、実際は広島県の人の中から適当な方法で何人か 選んで調べ、それを元に広島県の人全体を推測します。この実際に調査する対象を標本と 言い、母集団の中から無作為抽出(ランダムサンプリング)によって選びます。以下はそ の概念図です。
図2.4.1 母集団と標本
この推測の方法を学ぶのが推定と検定です。考え方は推定が簡単ですが、実用では検定と 呼ばれる方法がよく使われます。しかし、データの数が多い場合など、最近では推定も多 く使われるようになっています。ここでは検定の考え方を簡単な例を使って説明します。
例
超能力を持つという人にコインの裏表を当てる実験をしてもらい、100回の試行で70%の正 解率を得た。この人には本当に超能力があると考えられるか?
有意水準を5%として判定せよ。20回の試行ではどうか。
有意水準(危険率):超能力があると判定して間違う確率
この問題では70% の正解率が確かに超能力によって起こったものか、偶然に起こったもの かを判定します。
答えを得るには適合度検定またはχ2検定という検定手法を利用します。多少説明不足の ところがありますが、直感を優先させるためにご容赦下さい。
まず我々はこの 70%の正解率は全くの偶然であるという仮説を考えます。この仮説を統 計用語で帰無仮説と呼びます。さて、この帰無仮説の下では、裏表が当たる確率も外れる 確率も0.5です。そうすると試行回数が100回ですから、偶然当たる回数の予測値は50回 で、外れる回数の予測値も 50 回になります。これらの回数を使って、以下の式χ2を考え ます。
外れる予測値 外れる予測値 外れた回数
当たる予測値
当たる予測値
当たった回数
2 22
( ) (
−)
− +
=このように定義したχ2は、統計学者により自由度 1 のχ2分布に従うことが示されてい ます。実際にこの値を計算してみましょう。
50 16 2 400 50
) 50 30 ( 50
) 50 70
(
2 22
= − + − = =
(~
12)母集団 標本
データ ランダム
サンプリング
推測
図2.4.2 自由度1のχ2分布
この横軸の16のところがこの数値で、χ2の値が16以上の領域(グラフと横軸の間の面積)
が、偶然に70回以上当たる確率です。上図では横軸に張り付いてこの領域は見えませんが 実際にその面積を求めるとp=
0 . 00006
(誤差は大きいでしょうが)になります。例えば この値はExcelで =chidist(16,1) として求めることができます。この確率から考えて、70回当たることは珍しいことでしょうか?この確率は10万回に6 回のことですから、ほとんどの人が珍しいと答えるでしょう。ではこの珍しいことが偶然 この場合に起こったと考えるべきでしょうか。やはりそうは思えません。ではどこに問題 があるのでしょうか。
我々は最初、70% の正解率は偶然によるという帰無仮説を考えました。そう考えるから
00006
.
=
0
p という結果が出てきましたので、どうやらこの帰無仮説に問題がありそうで す。実はこの帰無仮説が正しくなく、実際に何らかの超能力があると考えればこのような 問題は生じません。そこでこの帰無仮説を捨てて、この人には超能力がある、すなわち当 てる確率は0.5ではないと考えるべきでしょう。後者の仮説は対立仮説と呼ばれます。これ は統計用語で言うと、帰無仮説を棄却し、対立仮説を採択するとなります。この例題の答 えは「何らかの超能力がある」になりました。
さてこの理論にはもうひとつ問題が残っています。それは珍しい、珍しくないを決める 際に人の感覚を用いているところです。統計学者はこれを排除するために、ある確率を考 えました。1 つは最もよく利用される 0.05 という数値です。これを用いて、計算した結果 がp
0 . 05
のとき珍しいと判断して帰無仮説を棄却し、p0 . 05
の場合は偶然の可能性が 高いとしてそのまま帰無仮説を採択する方法が採られます。この 0.05という数値に根拠は ありませんが、これは超能力があると言ったときの間違える確率でもありますから、まあ 100回に5回くらいは容認しようといったところです。珍しいかどうかを判断する基準は他 に0.01がよく使われ、もっと厳密に判断したいという場合に使われます。これらの0.05や 0.01の確率は有意水準と呼ばれます。この例題の場合はもちろんp0 . 05
ですから、5% の 有意水準で超能力があるといえるとなります。試行回数が20回の場合、以下のような結論になります。
2 . 16 3 ) 2
10 6 ( ) 10 14
(
2 22
= − + − = =
p=
0.07364
0 . 05
より、超能力があるといえない。これらの結論からデータ数が多いほど差が見えてくるということが分かります。この検 定方法は適合度検定または
χ2分布の性質を利用することから、単純にχ2検定と呼びます。2.5 検定の形式
検定には大きく分けて2つの比較方法があります。1つは以下の図のように 1 つの母集 団から 1 つの標本を取り出し、それを使って母集団の平均などの統計量をある指定値と比 較する検定です。
図2.5.1 母集団の統計量と指定値との比較
先に例で述べた場合もこの群に入り、母集団は無限個の成功と失敗の事例の集合でその 中から100個標本をとり、比較するものは母集団の成功比率と指定比率0.5です。
2つ目の方法は以下の図のように2つの母集団間の同じ統計量同士の比較です。
図2.5.2 母集団間の統計量の比較
母集団A 平均 未知 分散 未知
標本 平均 x2
分散 u22
母集団B 平均 未知 分散 未知
推測 比較
標本 平均 x1 分散 u12
推測
指定値 μ
標本 平均 x 分散 u2 母集団
平均 未知 分散 未知
推測 比較
2.6 検定選択ツリー
この節では今後我々が学ぶ検定手法についてまとめておきます。右端のxx検定と名前 が付いているところが選択すべき検定手法で、そこに到達するまでに、例えば量的なデー タでは、対応の有無、正規性の有無、等分散性の有無で分けられて行きます。この流れが 理解できるようになればこの本の目的はほぼ達成されたことになります。
適合度検定 対応の有無 検定手法
McNemar検定 χ2検定
対応あり 対応なし 指定比率との比較
多群間の比較
図2.6.1 質的データの検定手法
t検定
Welchのt検定
Wilcoxonの順位和検定
Wilcoxonの符号付順位和検定
対応のある場合のt検定 異分散
等分散 正規性あり
正規性なし 正規性あり 正規性なし 対応なし
対応あり 指定値との比較
対応の有無 正規性 等分散性 検定手法 母平均のt検定
Wilcoxonの符号付順位和検定
正規性あり 正規性なし
2群間の比較
図2.6.2 量的データの検定手法
以後、これらの検定を詳細に見て行きます。