• Tidak ada hasil yang ditemukan

PDF 2,4 8,16 8,4 0.4 n=4 - 福山平成大学

N/A
N/A
Protected

Academic year: 2024

Membagikan "PDF 2,4 8,16 8,4 0.4 n=4 - 福山平成大学"

Copied!
8
0
0

Teks penuh

(1)

2.3 標準正規分布から導かれる分布 【動画】

この後検定について話を始めますが、そのとき出てくる分布の名前はχ2分布、F分布、t 分布の 3 つです。下にそれぞれの確率密度関数の形や定義式などを書いてありますが、そ の部分はほとんど知らなくても結構です。ただこれらの分布が標準正規分布を基礎にして いることとそれぞれの分布に自由度と呼ばれる整数のパラメータがあって、その値によっ て確率密度関数の形が変わるということは記憶しておいて下さい。各分布の自由度の数は、

χ2分布で1つ、F分布で2つ、t分布では1つです。またこれらの分布は自由度を下に付け て以下の略号で表されます。

χ2分布:

n2 F分布:

2 1,n

Fn t分布:

t

n

覚えるのは分布の名前とこれらが正規分布と関係するということだけで結構です。

χ2分布(カイ2乗)

) 1 , 0 (

~ N

X

i 分布で独立なとき、

2 1

2

2

~

n

n i

X

i

 

=

=

分布(自由度n

2分布)

F分布

2 2 1

~ 

n1

分布, 22 2

~ 

n2

分布で独立なとき、

2 1, 2 2 2

1 2

1

~ F

n n

n F n

= 

分布

(自由度n1, n2のF分布)

t分布

) 1 , 0 (

~

N

X 分布,

2

~ 

n2分布で独立なとき、

tn

n

t X

~

2

= 分布(自由度nt分布)

注)

t

2

~ F

1,n分布

注)

n → 

N

( 0 , 1 )

分布

0 1 2 3 4 5

0.2 0.4

n=1

n=2

n=3

n=4

0.5

1 2 3 4 5

0 1

2,4 8,16 4,8

8,4

-2

0.2

-4 0 2 4

0.4 n=4

n=2 n=1

(2)

が表示されます。

図2.3.2 検定値と確率画面

例えば試験成績の分布で

N ( 65 , 8

2

)

の場合、

x  74

の確率を求めるには、正規分布の平 均と分散(または標準偏差)の値を、分布名の横の値のところに170を書き込み、「→」ボ タンをクリックすると以下のように上側確率と両側確率が表示されます。逆に上側確率か 両側確率かを書き込み、「←」ボタンをクリックすると平均値より大きい側の検定値が表示 されます。

図2.3.3 正規分布と検定確率

同様にχ2分布についても、検定値と自由度を書き込んで「→」ボタンをクリックすると 上側確率が、逆に上側確率を書き込んで「←」ボタンをクリックすると検定値が表示され ます。F分布やt分布についても同じです。

ここで上側確率と両側確率については正規分布を例に取ると以下のようになります。

(3)

図2.3.4 上側確率と両側確率

正規分布から導かれる分布の密度関数を描くには、メニュー[分析-基本統計-正規分布 と確率-密度関数グラフ]を選択します。以下が実行画面です。

図2.3.5 密度関数グラフ

ここではまず軸の設定を行います。慣れるまでは x 軸の設定がうまく行かないと思います が、何度か試すと慣れてきます。特に問題を解く際には、結果のグラフの軸を参考にして 下さい。描画は、分布を選択し、自由度などを与えた後、「グラフ描画」をクリックします。

問題1 以下の値を求めよ。

1)N

( 0 , 1 )

分布,x1.5のときの上側確率 p/2 [ ] 2)N

( 0 , 1 )

分布,x1.5のときの両側確率 p [ ] 3)N

( 170 , 64 )

分布,x180のときの上側確率 p/2 [ ] 4)

52分布,

210のときの上側確率 p [ ] 5)

102 分布,上側確率0.05のときの

2値 [ ] 6)F8,4分布,F10のときの上側確率 p [ ] 7)F 分布,上側確率0.05のときのF値 [ ]

両側確率 上側確率

(4)

問題2 以下のグラフを描け。

1)N

( 0 , 1 )

分布 2)自由度4のχ2分布

3)自由度8,4のF分布 4)自由度1のt分布

解答1

1)N

( 0 , 1 )

分布,x1.5のときの上側確率 p/2 [0.06681]

2)N

( 0 , 1 )

分布,x1.5のときの両側確率 p [0.13361]

3)N

( 170 , 64 )

分布,x180のときの上側確率 p/2 [0.10565]

4)

52分布,

2値10のときの上側確率 p [0.07524]

5)

102 分布,上側確率0.05のときの

2 [18.02059]

6)F8,4分布,F10のときの上側確率 p [0.02059]

7)F10,5分布,上側確率0.05のときのF値 [4.73506]

8)t10分布,

t

値2のときの上側確率

p/2

[0.03669]

9)t10分布,

t

値2のときの両側確率

p

[0.07339]

10)t10分布,両側確率0.05のときの

t

値 [2.22814]

解答2 省略

2.4 検定の基礎

統計では調査したい対象を母集団と言います。しかし、例えば広島県の成人などとした 場合、調査の費用は莫大かかりますので、実際は広島県の人の中から適当な方法で何人か 選んで調べ、それを元に広島県の人全体を推測します。この実際に調査する対象を標本と 言い、母集団の中から無作為抽出(ランダムサンプリング)によって選びます。以下はそ の概念図です。

(5)

図2.4.1 母集団と標本

この推測の方法を学ぶのが推定と検定です。考え方は推定が簡単ですが、実用では検定と 呼ばれる方法がよく使われます。しかし、データの数が多い場合など、最近では推定も多 く使われるようになっています。ここでは検定の考え方を簡単な例を使って説明します。

超能力を持つという人にコインの裏表を当てる実験をしてもらい、100回の試行で70%の正 解率を得た。この人には本当に超能力があると考えられるか?

有意水準を5%として判定せよ。20回の試行ではどうか。

有意水準(危険率):超能力があると判定して間違う確率

この問題では70% の正解率が確かに超能力によって起こったものか、偶然に起こったもの かを判定します。

答えを得るには適合度検定またはχ2検定という検定手法を利用します。多少説明不足の ところがありますが、直感を優先させるためにご容赦下さい。

まず我々はこの 70%の正解率は全くの偶然であるという仮説を考えます。この仮説を統 計用語で帰無仮説と呼びます。さて、この帰無仮説の下では、裏表が当たる確率も外れる 確率も0.5です。そうすると試行回数が100回ですから、偶然当たる回数の予測値は50回 で、外れる回数の予測値も 50 回になります。これらの回数を使って、以下の式χ2を考え ます。

外れる予測値 外れる予測値 外れた回数

当たる予測値

当たる予測値

当たった回数

2 2

2

( ) (

)

− +

=

このように定義したχ2は、統計学者により自由度 1 のχ2分布に従うことが示されてい ます。実際にこの値を計算してみましょう。

50 16 2 400 50

) 50 30 ( 50

) 50 70

(

2 2

2

= − + − =  =

(~

12

母集団 標本

データ ランダム

サンプリング

推測

(6)

図2.4.2 自由度1のχ2分布

この横軸の16のところがこの数値で、χ2の値が16以上の領域(グラフと横軸の間の面積)

が、偶然に70回以上当たる確率です。上図では横軸に張り付いてこの領域は見えませんが 実際にその面積を求めるとp=

0 . 00006

(誤差は大きいでしょうが)になります。例えば この値はExcelで =chidist(16,1) として求めることができます。

この確率から考えて、70回当たることは珍しいことでしょうか?この確率は10万回に6 回のことですから、ほとんどの人が珍しいと答えるでしょう。ではこの珍しいことが偶然 この場合に起こったと考えるべきでしょうか。やはりそうは思えません。ではどこに問題 があるのでしょうか。

我々は最初、70% の正解率は偶然によるという帰無仮説を考えました。そう考えるから

00006

.

=

0

p という結果が出てきましたので、どうやらこの帰無仮説に問題がありそうで す。実はこの帰無仮説が正しくなく、実際に何らかの超能力があると考えればこのような 問題は生じません。そこでこの帰無仮説を捨てて、この人には超能力がある、すなわち当 てる確率は0.5ではないと考えるべきでしょう。後者の仮説は対立仮説と呼ばれます。これ は統計用語で言うと、帰無仮説を棄却し、対立仮説を採択するとなります。この例題の答 えは「何らかの超能力がある」になりました。

さてこの理論にはもうひとつ問題が残っています。それは珍しい、珍しくないを決める 際に人の感覚を用いているところです。統計学者はこれを排除するために、ある確率を考 えました。1 つは最もよく利用される 0.05 という数値です。これを用いて、計算した結果 がp

0 . 05

のとき珍しいと判断して帰無仮説を棄却し、p

0 . 05

の場合は偶然の可能性が 高いとしてそのまま帰無仮説を採択する方法が採られます。この 0.05という数値に根拠は ありませんが、これは超能力があると言ったときの間違える確率でもありますから、まあ 100回に5回くらいは容認しようといったところです。珍しいかどうかを判断する基準は他 に0.01がよく使われ、もっと厳密に判断したいという場合に使われます。これらの0.05や 0.01の確率は有意水準と呼ばれます。この例題の場合はもちろんp

0 . 05

ですから、5% の 有意水準で超能力があるといえるとなります。

試行回数が20回の場合、以下のような結論になります。

2 . 16 3 ) 2

10 6 ( ) 10 14

(

2 2

2

= − + − =  =

(7)

p=

0.07364

0 . 05

より、超能力があるといえない。

これらの結論からデータ数が多いほど差が見えてくるということが分かります。この検 定方法は適合度検定または

χ2分布の性質を利用することから、単純にχ2検定と呼びます。

2.5 検定の形式

検定には大きく分けて2つの比較方法があります。1つは以下の図のように 1 つの母集 団から 1 つの標本を取り出し、それを使って母集団の平均などの統計量をある指定値と比 較する検定です。

図2.5.1 母集団の統計量と指定値との比較

先に例で述べた場合もこの群に入り、母集団は無限個の成功と失敗の事例の集合でその 中から100個標本をとり、比較するものは母集団の成功比率と指定比率0.5です。

2つ目の方法は以下の図のように2つの母集団間の同じ統計量同士の比較です。

図2.5.2 母集団間の統計量の比較

母集団A 平均 未知 分散 未知

標本 平均 x2

分散 u22

母集団B 平均 未知 分散 未知

推測 比較

標本 平均 x1 分散 u12

推測

指定値 μ

標本 平均 x 分散 u2 母集団

平均 未知 分散 未知

推測 比較

(8)

2.6 検定選択ツリー

この節では今後我々が学ぶ検定手法についてまとめておきます。右端のxx検定と名前 が付いているところが選択すべき検定手法で、そこに到達するまでに、例えば量的なデー タでは、対応の有無、正規性の有無、等分散性の有無で分けられて行きます。この流れが 理解できるようになればこの本の目的はほぼ達成されたことになります。

適合度検定 対応の有無 検定手法

McNemar検定 χ2検定

対応あり 対応なし 指定比率との比較

多群間の比較

図2.6.1 質的データの検定手法

t検定

Welchのt検定

Wilcoxonの順位和検定

Wilcoxonの符号付順位和検定

対応のある場合のt検定 異分散

等分散 正規性あり

正規性なし 正規性あり 正規性なし 対応なし

対応あり 指定値との比較

対応の有無 正規性 等分散性 検定手法 母平均のt検定

Wilcoxonの符号付順位和検定

正規性あり 正規性なし

2群間の比較

図2.6.2 量的データの検定手法

以後、これらの検定を詳細に見て行きます。

Referensi

Dokumen terkait

Dに収束する有界で面積確定の領域の列{Dn}が存在し,関数fはD上で 定義され任意のnに対しDn上で有界で積分可能であり, limn R Dn|fx, y|dxdyが存在す ると仮定する.. このとき, 極限値limnR Dnfx, ydxdyが領域の列{Dn}の取り方によら ず存在するので,その極限値をR Dfx,

固有値・固有ベクトル 以後、F を代数閉体とする。ここで、F が代数閉体とは、任意のF 係数の1 次以上の 代数方程式fx = 0が F の中に解を持つような体のことである ノートの最後の補足を 見よ。例えば、複素数体 C は代数閉体である。このノートを読むときには、体とは有理 数体Q、実数体 R または複素数体 Cで、それが代数閉体のときは Cと思えばよい。

6 交付内定から科研費の受領、その後の科研費の執行、年度毎や研究期間終了後の報告書の提出な ど、補助事業の遂行のためには、様々な手続きが必要になります。 これらの手続きが期日までに行われない場合は、科研費の執行に支障が発生しますので、注意が必 要になります。 ①科研費の採択時の流れと提出する書類(研究代表者のみ)

6 交付内定から科研費の受領、その後の科研費の執行、年度毎や研究期間終了後の報告書の提出な ど、補助事業の遂行のためには、様々な手続きが必要になります。 これらの手続きが期日までに行われない場合は、科研費の執行に支障が発生しますので、注意が必 要になります。 ①科研費の採択時の流れと提出する書類(研究代表者のみ)

開設者名 講習の名称 講習の開催地 時間数 受講料 福山平成大学 【必修】時代をリードする教師の専門性 (主として幼・小教諭) 広島県福山市 6時間 6,000円 福山平成大学 【必修】時代をリードする教師の専門性 (主として中・高・養護教諭) 広島県福山市 6時間 6,000円 免許職種,教科等 福山平成大学 【選択必修】進路指導及びキャリア教育

アドミッション・ポリシー(入学者受け入れの方針) 助産学専攻科では、女性や家族に寄り添い、生涯にわたる女性の健康を支援できる人材を育成しま す。そのために、以下のような意欲と熱意を持った人を積極的に受け入れます。 1.母性看護学に関心を持ち、学び、自己研鑽できる人。 2.母性看護の対象であるすべての年代の女性の母性を健全に育成する役割を果たすことができる人。

5.開設される授業科目(本プログラムを構成する授業科目) 令和4年度入学生に対して開講される授業科目(本プログラム(リテラシーレベル)を構成する授 業科目)は次の通りです。 一般教育科目: 情報リテラシーA,情報リテラシーB データサイエンス入門 データ科学のための数理統計 人工知能概論 データサイエンス応用 データリテラシー

④ 受講受け入れ決定 ③ 受講希望票の提出 【第 1 次申込】 ※ここでは受講はまだ確定していません。 ⑤ 受講申込書等の提出および受講料の納付 【第 2 次申込】 ※ここで受講が確定します。 ⑥ 講習受講・修了認定試験 ⑧ 免許状更新講習修了確認の申請 ① 受講対象者であることの確認 所有免許・生年月日・職種等 ⑦ 修了履修証明書の発行 ②