• Tidak ada hasil yang ditemukan

改訂増補版:統計検定を理解せずに使っている人のために II

N/A
N/A
Protected

Academic year: 2023

Membagikan "改訂増補版:統計検定を理解せずに使っている人のために II"

Copied!
18
0
0

Teks penuh

(1)

改訂増補にあたって

この総説は,「統計検定を理解せずに使っている人の ためにII」の改訂増補版であり,「改訂増補版:統計検 定を理解せずに使っている人のためにI」の続きである.

改訂増補に当たっての詳細は,「改訂増補版:I」の冒頭 をお読みいただきたい.この改訂増補版では,「II」に あった誤りを修正した.また,理解しにくい部分につい て,さらにわかりやすい説明に努めた.

「改訂増補版:I」では,母集団,標本,母分散,母標 準偏差,標本分散,標本標準偏差,不偏分散,不偏標準 偏差,パラメトリック検定とノンパラメトリック検定の 違い,正規性の検定について主に記述した.これらの理 解が曖昧な場合は,再度「改訂増補版:I」をお読みい ただきたい.今回は,標準誤差,2群のパラメトリック 検定の基本,有意差の意味,2群のノンパラメトリック 検定の基本をおもに,記述した.なお,図番号は,前回

「改訂増補版:I」からの通し番号である.まず,図の内 容をざっと眺めてから文章をお読みいただきたい.

パラメトリック検定(図16

パラメトリック検定は母集団が正規分布していると仮 定する(図16).平均値や分散などのパラメータを使う ことからこの名称がある.パラメトリック検定の例とし

ては,Studentの 検定や分散分析などがある.前回と 同様,母集団の大きさは ,母平均はμ,母分散はσ2と 定義する.母平均μ,母分散σ2の正規分布を (μ, σ2) と記述することとする.

パラメトリック検定の基本:母集団から取り出した 個の標本の平均値(標本平均)の分布を考える

(図17

かなり込み入った話になるので,注意して読んでほし い.じっくり読まないと難しいが,ここを理解できない と標準誤差SEt検定は理解できない.ここでは,母 図16パラメトリック検定

日本農芸化学会

● 化学 と 生物 

セミナー室

研究者のためのわかりやすい統計学-5

改訂増補版:

統計検定を理解せずに使っている人のためにII

池田郁男

東北大学未来科学技術共同研究センター

(2)

集団から取り出した 個の標本の平均値(標本平均)

¯ の分布を考える.個々の標本データの分布ではない ので注意してほしい.

図17上のように,正規分布している母集団 (μ, σ2) から 個の標本を取り出し標本平均 ¯1を計算する.こ れを何度も繰り返すとそれぞれ標本平均 ¯1,  ¯2,  ¯3,  … が得られる.このたくさん得られた標本平均を一つの別 の母集団と考えて分布を調べると,正規分布し,その平 均値は母平均μに近づくことが知られている*1.しか し,最初の母集団の正規分布 (μ, σ2)とはバラツキ方

(母分散)σ2が異なり,1/ だけ小さいバラツキ方σ2/ になることがすでにわかっている.つまり,(μ, σ2/ ) の正規分布となる(図17下グラフ)*1.すなわち,標本 平均の母標準偏差 は  σ2/n=σ/ n  となり,σよりも 

1/ n  だけ小さくなる*2.図17では例として,ある一 つの標本平均 ¯1の位置を正規分布グラフに赤字で示し ている.

正規分布を標準正規分布に変換する(図18 正規分布はμとσ2が違えば分布が異なるので(図18 左上と左下のグラフのように),いろいろな母集団でい 図17パラメトリック検定の基本

*1これはたいへん重要なポイントで,中心極限定理と呼ばれる.

標本の大きさ が大きいほど,標本平均 ¯ の平均値は母平均μ 近づき,その分散は母分散σ2の1/ に近づく. が大きいほど 

/ n

σ は小さくなるので,母平均の範囲が絞られてくることを意 味する(図17下グラフ).なお, が大きい場合,母集団が正規分 布に限らず,正規分布から外れていても,その母集団からとった 標本平均の分布は正規分布するというおもしろい性質がある.

*2実験動物の母集団を例にとれば,たとえばその中から6匹を標 本として取り出して,測定したパラメータの標本平均を計算する.

この操作を何度も繰り返して得られる多くの標本平均のバラツキ は,個々に外れたデータがあっても平均化されるため,母集団の データのバラツキよりも小さくなることは,予想できるであろう.

日本農芸化学会

● 化学 と 生物 

学生を含めて生命科学系研究者の多くは統計検定 を利用している.しかし,多くの論文,学会発表に おいて統計検定が誤用されているため,研究の信頼 性が揺らいでいる.世界中の研究論文の30〜50%は 統計に何らかの問題があるという調査結果があり,

日本だけの問題ではない.統計の誤用が多い理由は,

研究者が統計を理解していないからにほかならない.

標準偏差(SD)や標準誤差(SE)が何を意味するの か理解していない研究者は少なくない。研究者は論 文や学会発表で不備のない検定法を知りたいが、多 くの統計書はその期待に応えてくれず、間違った統 計が横行する原因となっている。

また、統計は有意差を出すためのツールとしか認 識していない研究者が多いように見受けられる.一 度の実験で都合のよいデータが得られると,疑いも せずに論文化している研究者が多いと考えられる.

その結果,世界的に再現性のないデータが氾濫して いる.2016年のNatureの科学者を対象とした調査に よると60〜80%の研究者が他の研究者の実験は再現 性が得られないと回答し,さらに驚くべきことに50

〜60%の研究者は自分の実験に再現性がないと回答 している.バイテク企業Amgenの研究者が,53のが ん研究を再試験したところ,再現できたのは6研究し かなかったと報告している(僅か11%).

この調査結果から,多くの研究が再現性を調べず に論文化されていること,および,かなりの研究者 はそのことを認識していることがわかる.統計を理 解していれば,標本データを用いた研究結果は必ず しも真実を語っておらず再現性を調べることは必須 であるとわかるはずである.再現性をみていない研 究がこれだけ多く世に出回っていることは,単純に 統計を理解しておらず問題はないと考えているのか,

あるいは,再現性がない可能性もあるが、業績を増 やすためにとりあえず論文化しているかのどちらか であろう.また,上述の調査では,「都合のよい報告 だけを行っている」と回答した研究者が70%弱も存 在した.このような研究者の論文を真剣に読む価値 はあるのだろうか? もはや,科学研究は危機的状 況にあると言わざるをえない.このセミナーを読ん だ皆さんが,統計を正しく理解し,倫理観をもって 科学研究に貢献することを切に期待する.

コ ラ ム

(3)

ちいち異なる正規分布を用いて考えるのは面倒である.

そこで,母平均μが0(ゼロ)で,σ2が12の正規分布を 標準正規分布と定義し,それぞれの異なる正規分布を標 準正規分布に変換して考えることに決められている.そ うすれば,どのようなμとσ2の母集団でも標準正規分布 で考えることができる.図18の右のグラフが標準正規 分布である*3.そこで,先ほどの標本平均 ¯1(図17下 グラフと図18左上と左下グラフ)を標準正規分布の値 に変換することとする(これを標準化と呼ぶ).まず,

標準正規分布では母平均はゼロであるから,母平均μを ゼロに移動するためには,μで引いてやればよい.すな

わち,( ¯1−μ)である.一方,標準正規分布では母標

準偏差は1であるから, σ/ n  を1に変換するためには  / n

σ   で割ってやればよい.すなわち,標本平均 ¯1を 標準化し,変換した値を 1とすると,以下の式で表す ことができる(図18中央の式). 

1 (X µ1 ) Z

σn

=

そうすると,¯1は図18右の標準正規分布グラフ中の

1に変換される*4.このような標準化を行えば,異な る母集団の正規分布(図18の左上および下グラフ)の 標本平均でも,同様に標準正規分布にデータ変換するこ とができる.

このデータ変換はたいへん重要であるが少しわかりに くい.そこで,数式ではわかりにくいので,簡単な例を 示す.図19を見て欲しい.今第1の母集団として,μ=

10,  σ/ n=2の正規分布があり,¯1=12の標本平均が 得られたとする(図19左上グラフ).次に,第2の母集 団としてμ=20, σ/ n =4の正規分布があり,¯1=24が 得られたとする(図19左下グラフ).これらの数字を上 式に代入すると,どちらも 1=1が得られる(図19中央 式と右グラフ).これらの2つの異なる正規分布では,

母平均μ,母標準偏差 σ/ n 標本平均 ¯1の数値はそれ ぞれ異なるが,標準正規分布にデータ変換すると同じ値 となり,標準正規分布での 1の位置は,両母集団で同 じであることがわかる.標本平均 ¯1が標準正規分布中 の 1に標準化されたことを理解して欲しい.

母標準偏差σはわからないので,不偏標準偏差uに 置き換える(図20

ここまで,正規分布している母集団から取り出した標 本データの平均値すなわち標本平均の分布は正規分布す ることを述べてきたが(図20左上グラフ,これを (μ,  σ2/ )とした),バラツキ(母標準偏差)は σ/ n  であ る.ここで,もともとの母集団の母標準偏差σは,生命 科学系の研究では通常知ることができない値であり,こ のままでは, σ/ n  を計算することができない.では,

どうすればよいのか?

ここで,前回「改訂増補版:I」で登場した不偏標準 偏差uを思い出して欲しい(前回の図12および13)*5. 図18標準正規分布へのデータ変換

図19標準正規分布への標準化の実例

*3前回でも述べたが,本セミナーのすべての図は筆者が模式的に 作成したものであり正確なものではない.

*4この式でなぜ標準正規分布の値に変換されるのか不思議に思う かもしれないが,数学的な証明はなされている.

*5本総説では,不偏分散u2をルートした値uを不偏標準偏差と名 付け,母標準偏差を推定する値として論じている.しかし,uは 真の不偏標準偏差ではない(「改訂増補版:I」の*13参照).正確 な不偏標準偏差とはズレがあり,特に, が10以下で,小さいほ どズレが大きい.

日本農芸化学会

● 化学 と 生物 

(4)

標本データから母標準偏差σを推定する値として計算で きるのが不偏標準偏差uである.そこで,母標準偏差 σを不偏標準偏差uに置き換えることとする.この計算 値をt1とする.

= 1

1 (X µ)

t u

n

そこで,何度も標本を取って標本平均 ¯1,  ¯2,  ¯3…お よびu1, u2, u3…を計算し,さらに 123…を計算してt 値の分布を調べる.σを用いた場合,分布は正規分布す るので標準正規分布に変換されたが(図20左上グラフ から右上グラフへ),uに置き換えると,正規分布とは 少し異なる分布になる(図20左上グラフから右下グラ フへ)*6.この分布は 分布と名付けられた(図20右下 グラフおよび図21のグラフ). 分布のグラフは,正規 分布よりも両裾が広がっていることに注意して欲しい.

不偏標準偏差uは母標準偏差σを推定している.しか

し,uは真の不偏標準偏差ではないため,標本の大きさ の影響を受ける*6. が小さいと大きな影響を受けu はσからのズレが大きく,値としては小さくなる(改訂 増補版:Iの*13参照).一方, を大きくとると,uはあ まり影響を受けずσに近い値となる*51の式と図21の 分布グラフを見て欲しいが, が小さいとuはσより小 さな値となるため,計算される 値は 分布の中心のゼ ロから離れた値となる場合が相対的に多くなる.そうす ると,正規分布に比べて 分布の裾野が相対的に広がる こととなる.一方, が大きくなると,uはσに近づくの で,値の分布は正規分布に近づいていく(図21のグラ フ).つまり, 分布は が違うとグラフの形が異なるこ とを理解して欲しい*7

ここでは標本平均の分布やバラツキを考えてきたこと から,上の 1式の分母である u n/ は標本平均がどのよ うなバラツキ方をしているかを示しており,これが多く の研究者が用いる標準誤差(standard error; SE)であ る.    は標本平均の母標準偏差であったので(図 17),標準誤差は標本平均の母標準偏差を推定する値と なる.つまり,SEは母平均μがどのあたりにあるのか,

すなわち,母平均μのありそうな範囲を表している.

SEを標本データのバラツキの一種と考えている読者 がいるかもしれないが,それは間違いであり,SEには 標本データのバラツキの意味はない.1の式の分母が SEであるから,上の式は以下のようにも書ける. 

/ n σ 図20母標準偏差σの不偏標準偏差uへの置き換え

図21標準正規分布と 分布の違い

*6この点が,uは 不偏 でないことを示している. 不偏 とは 偏らないことで,偏りなく母集団を推定できることを意味する.

もし,uが 不偏 であれば,母標準偏差σを推定する値となるの で,σをuに置き換えても正規分布となるはずである.ところが,

uはσとはズレがあるために正規分布とはすこしずれた 分布とな る. が小さいほどズレが大きくなるため,分布は正規分布と大 きくずれ, が大きいほど正規分布に近い分布となる(図21のグ ラフ参照)

*7t分布は,実際は ではなく自由度 −1に依存して形が変化す る.自由度は何度か登場した.不偏分散の計算では,平方和を で割るのではなく,自由度 −1で割ると母分散を推定できる値と なることを述べた.今後は −1以外の自由度も登場するが,どの ような場合でも,自由度を用いることで母集団の情報を推定でき ると考えればよい. バイオサイエンスの統計学 では,自由度と は,データのバラツキや偏りを予測する際に(つまり,分散や標 準偏差を計算する際に),他と独立して扱えるデータ数のことと述 べている(1).たいへんわかりづらいが,たとえば,ある母集団か ら,標本を6個採取した場合,それぞれが関連のない独立した標 本であれば,自由度は6である.しかし,すでに述べてきたよう に不偏分散を計算する際に,計算式に標本平均が入っている.式 に標本平均があると, が6の場合,5個のデータがあれば,6個 目のデータは標本平均×6から(5個の標本データの合計)を引き 算すれば求まる.つまり,独立して扱えるデータ数は5であり,6 個目は自動的に決まってしまい自由に動けない.したがって,自 由度は1減ってしまい,5となる.つまり,標本の大きさを とす ると自由度は −1となるのである.

日本農芸化学会

● 化学 と 生物 

(5)

= 1

1 ( )

X µSE t

つまり,この式は,母平均μのありそうな範囲である 標準誤差SEを基準(分母)にして,標本平均 ¯1が母平 均μからどれ位離れているか(分子)を計算しているの である.たとえば,¯1‒μ>0と仮定して,分母のSEが 小さければ,分子の( ¯1‒μ)は相対的に大きくなるの で 1値 は ゼ ロ か ら 離 れ る.逆 に,SEが 大 き け れ ば,

( ¯1‒μ)は相対的に小さくなるので 1値はゼロに近づ く.この感覚を理解して欲しい.

標本平均±SEは何を意味しているのか?(図22 標本データの平均値(標本平均)は母平均μを推定す る値と位置づけられる.そして,SEは母平均μのあり そうな範囲を示している(図22).SEの式を見ると,

SEは標本の大きさ が大きくなればなるほど,小さく なることがわかる.これは, が増えれば増えるほど,

母平均μの存在する範囲が絞り込まれることを意味す る. が増えて,母集団の大きさ に近くなればなるほ ど,μが絞り込まれていくことは感覚的に理解できるの ではないだろうか*8

標本平均±SDと標本平均±SEは何が違うのか?

(図23

標本平均±SDについては,前回の図15でも記述した ように,研究者は母平均μと母標準偏差σの両方に関心 があるはずである(図23).それでは,標本平均±SEで はどうであろうか? SEは母平均μのありそうな範囲 を示していることから,母平均μに関心が集中している のであり,母標準偏差σには原則的には関心がないこと になる.母平均μをSEによりどこまで絞り込んだかが 焦点である(この点は『らくらく生物統計学』(2)に詳し く述べられている).

実例を図23中段に示している.ある機能性成分が母 平均μを変化させるかどうかにのみ関心があるのであれ ば,SEを使えばよい.図23下段に示すような例では,

SDが適している.しかし,学会発表や論文を見るかぎ り,SEとSDを上記の観点から使い分けている研究者は 少ないように思われる.SDを使うか,SEを使うかは研

究室毎に決まっているのではなく,あくまでも何が知り たいのかで決まるのである.このセミナーの読者は,

SDとするのかSEとするのか,よく考えて使い分けて欲 しい.

2群の差の検定(Studentの 検定)(図24, 25 ここからいよいよ群間比較,群間の有意差検定に入 り,「有意差」について説明していく.生命科学系の研 究では,2群あるいは3群以上を設定して,群間比較を 行う実験が多いのではないだろうか? その基本となる のが,Studentの 検定である.t検定は2群のパラメト リック検定であり, 分布を用いることからその名があ る.しかし,統計書を読んでも,計算方法はわかるが,

その原理は簡単には理解できない場合が多い.かなり複 雑であるが,t検定の原理をマスターすれば,そのほか の多様な検定も,実は基本的な手順は同じであることか 図22標本平均±SEの意味

図23標本平均±SDと標本平均±SEの違い

*8なお,学会発表において,スライドに標本の大きさ や標本平 均±SEなのか±SDなのか表記していない発表が数多く見受けら れる.これらは重要な情報であり,その表記は研究者としての基 本である.書き忘れたで済むものではない.

日本農芸化学会

● 化学 と 生物 

(6)

ら,理解しやすいはずである.

詳しくは後述するが, 検定には主に対応のない独立 2群の検定(unpaired   test)と対応のある関連2群の 検 定(paired   test) が あ る.こ こ で は,unpaired    testを例として詳述する.

図24の右上図に,2群の標本平均 ¯1と ¯2が示されて いる.この2群の間に「差がある」かどうかは,基準が ないと決められない.たとえば,¯1と ¯2間に10%以上 差があれば差があることにしようという基準である.し かし,「改訂増補版:I」の図4で説明したように,差が あるかどうかは標本平均の差だけでなくデータのバラツ キ方によっても判断が変わるので,基準を決めることは 困難である.そこで統計学では,「差がない」という仮 説から考えていくことに決まっている.この「差がな い」という仮説を帰無仮説と呼ぶ.これに対して「差が ある」という仮説を対立仮説と呼ぶ.「差がない」こと から考えていく考え方は,群間比較を行う検定において は基本的考え方であり,共通しているので,記憶して欲 しい.

そこで,考え方として,同一母集団から標本をとると 考える(図24下図).たとえば,今一つの母集団から,

それぞれ 1および 2個の標本を取り2群とする.この 場合,2群のそれぞれ個々の標本には対応(関連)はな く独立しているので,対応のない独立2群の検定(un- paired   test)となる.2群それぞれの標本平均を ¯1

¯2とする(図24).このように標本を取れば,もともと 同じ母集団であるから,本来は差はないはずであるが,

標本なので標本平均 ¯1と ¯2は必ずしも一致はしないと いう状況となる.

ここで,便宜的に,2つの標本 ¯1と ¯2の母集団の母 平均をそれぞれμ1とμ2とし,母分散をσ12σ22とする.

(同じ母集団からの標本であるから,実際はμ1=μ2およ びσ12σ22であるが).ここで,帰無仮説は「差がない」

とするのでμ1=μ2となる.これに対して対立仮説は,

「差がある」とするので,μ1≠μ2となる.

母集団から 個の標本を取って標本平均 ¯ を得たと して,これを無限に繰り返したとき標本平均は正規分布 し,母分散はσ2/ ,母標準偏差は σ/ n   となることは すでに述べた(図17下グラフ).それでは,ある正規分 布する母集団から標本データを 1および 2個取り出し,

標 本 平 均 ¯1と ¯2を 求 め る.そ し て,標 本 平 均 の 差

( ¯1‒ ¯2)を求めることとして,この操作を何度も繰り 返して( ¯1‒ ¯2)の分布を求めると,どうなるであろう か? 実はこの場合も正規分布するのである(図25左 上グラフ).( ¯1‒ ¯2)は同じ母集団からの標本平均の差

なので,ゼロを中心にばらつくと予想される.すなわ ち,正規分布の中心はμ1‒μ2=0である.( ¯1‒ ¯2)を一 つの母集団としたときの母分散は,それぞれの群の母分 散σ12/ 1およびσ22/ 2を足した値となる.すなわち, 

2 2

1 2

1 + 2

σ σ

n n  

これをルートすることで,母標準偏差が計算できる.

すなわち,母標準偏差は, 

2+ 2

1 2

1 2

n n

σ σ  

となるが,もともと同一母集団なのでσ1σ2であるか ら,これらをσとすると,以下の式となる(図25左グラ フ). 

図252群の標本平均の差も正規分布する!

図24統計検定の重要なポイント

日本農芸化学会

● 化学 と 生物 

(7)

+

1 2

1 1 n n σ

そこで,標本平均の差( ¯1‒ ¯2)がこの正規分布のど こにあるかを考えるが,ここで,図18で説明した,標 準正規分布へのデータ変換(標準化)を思い出して欲し い.

( ¯1‒ ¯2)を標準正規分布上の 1に変換すると以下の 式が出現する(図25中央上の式). 

μ μ

= σ

+

1 2 1 2

1

1 2

– –( – ) 1 1 Z X X

n n

この式が出現することがピンとこないようであれば,

「正規分布を標準正規分布に変換する(図18」の項を 読み返して欲しい.

ここで,μ1−μ2=0であるから,結局,次の式が得ら れ,標準正規分布の値に変換される(図25右上グラ フ). 

=σ +

1 2

1

1 2

1– 1 Z X X

n n

ここで,σはもともとの母集団の母標準偏差であり,

研究者は知ることができない.そこで,図20で説明し たことと同様の理由で,母標準偏差を推定する値である 不偏標準偏差 を用いることとする.このときの計算値 をt1とすると,次式となる(図25中央下式). 

= +

1 2

1

1 2

1– 1 u t X X

n n

さて,ここで不偏標準偏差uはどのように計算するの であろうか? 不偏標準偏差uの計算方法は前回の図12 でも説明したが,ここでは図26上の式を見て欲しい.

簡単には,平方和を自由度 −1で割り算し不偏分散を 求めルートした.しかし,ここでは2群あるので,2群 両方のバラツキを考慮すべきである.そこで,2群の平 方和を合算し,合算した自由度で割り算して,ルートす ればよい(図26最下の式).

母集団から 個の標本を取って標本平均 ¯ を得たと して,これを無限に繰り返したときの標本平均の分布 は,不偏標準偏差uを用いるとt分布することはすでに 述べた(図20右下グラフ).このことと同様に,上式で 計算した 1は,この計算を無限に繰り返すと 分布する ので, 分布中の値に変換される(図25右下グラフ).

分布については,図21の説明で詳しく説明した.

この 1値が 分布のどこに位置するかで,有意差を決 めていくことになるのである.ここまでの内容をしっか り理解したうえで,先に進んで欲しい.

ここまで,2つの標本平均の差( ¯1‒ ¯2)の分布は不 偏標準偏差uを用いると 分布することを述べてきた.

そして,ある2群の実験を行って得られたデータから,

1を計算した.この 1が 分布のどの位置にあるのかを 調べる(図25右下グラフの1の位置を調べる). 分布 はゼロを中心に左右にばらついている.¯1と ¯2に大き な差がなければ,( ¯1‒ ¯2)はゼロあたりにあるが,た またま大きな差があれば,ゼロから離れる.しかし,

分布のグラフからわかるように,ゼロから大きく離れる 確率は低く,滅多には起こらない.そこで,1が 分布 のかなり外れたあたりにくると,それは滅多に起こらな いまれなことが起こったのであるから,差があることに してしまおうというのが,「有意差がある」という決め 方になっている.つまり,同じ母集団からの2つの標本 平均の差( ¯1‒ ¯2)を,「差がない」という帰無仮説μ1

=μ2で考えてきたが,「差がない」と考えるには,あま りにも外れたあたりにあるので,帰無仮説μ1=μ2を棄 て(棄却し),差があるμ1≠μ2と考えることにしてしま おうという考え方である(対立仮説を採用することにす る).この「差がない」ことから考えてきたが,あまり にも差が大きいので「差がある」ことにしてしまおうと いうのが,群間比較の検定の基本的な考え方であるの で,記憶して欲しい.

ここで重要なポイントが見える.つまり,2群間に

「有意差がある」は,「真に差がある」ことを意味してい る訳ではないことである.多くの研究者は標本で研究し ている.標本で研究しているかぎり,たとえ有意差が 図26( ¯1¯2)の不偏標準偏差 の計算

日本農芸化学会

● 化学 と 生物 

(8)

あっても,差があるとは断定できないのである.した がって,標本を用いた1回の試験だけでは真実かどうか はわからない.研究者はいろいろな角度から研究し真実 を追究すべきである.

なお, 分布は自由度 −1によって分布の形が変化す ることはすでに述べた(図21と*7.ここでは2群ある ので,自由度は図26で述べたように合算して( 1−1)

+( 2−1)となり, 12−2である.したがって,自 由度 12−2の 分布で考えることとなる.

滅多に起こらないまれな確率の決め方(図27 それでは,滅多に起こらないまれな確率をどの程度に とればよいのであろうか? 図27の上に書いているよ うに,t分布全体の面積の両端それぞれ2.5%または 0.5%の合計(あるいは片端,これについては後述する)

の5%または1%とすることに決められている(母集団 全体を1とすれば,0.05あるいは0.01)*9.この判定基準 を有意水準と呼ぶ.標本平均 ¯1と ¯2はどちらが大きな 値になるのかわからない場合は,( ¯1‒ ¯2)はプラスに なるかマイナスになるかわからないので,t分布の左右 両端が設定され,それぞれ2.5%ずつあるいは0.5%ずつ にt値が入ってくると,まれなことが起こったと判定す るのである.しかし,滅多に起こらないまれなことと いっても,もともと「差がない」ことから考えてきたの であり,「差がある」と断言するのは危険である.そこ で,有意水準は危険率とも呼ばれる.なお,帰無仮説は 正しい,つまり差がないのに,帰無仮説を棄却する,つ まり差があるとしてしまう誤りを犯すことはありうる.

この誤りを第一種の過誤と呼ぶ*10

最近は, 値がわかればパソコンでt値よりも両端の 面積を計算してくれる. 分布の面積を1としたときの この両端の面積を 値と呼ぶ(図28.したがって,有 意 水 準(危 険 率) は 値 が0.05(5%) あ る い は0.01

(1%)である. はprobabilityの頭文字であり, 値と は観察された差が偶然生じる可能性を示す尺度というこ とになる.たとえば, =0.005とは,観察された差が偶 然起こるのは0.5%,つまり200回に1回であることを示 す.偶然に起こるのが200回に1回であれば,偶然に起 こったのではなく,ある意味をもって(有意に)起こっ

た可能性が高いと判断する.これを「有意差がある」と 表現する.

有意水準5%で考えると(図28左下枠内),有意水準 5%は同じ実験を20回行うと,1回程度は有意差がない のに有意となる可能性のある確率となる.それは1回目 に起こるかもしれない! 20回目に起こるかもしれな い! 実験は通常1回しか行わない.もし,1回目に起 これば,本当は有意差がないのに有意差ありと判定され ることになる(第一種の過誤).研究者はこのことを念 頭に置いておかねばならない.1回の実験だけで結果を 論文化する危うさはここにある.このことは先程述べた ように,真実を明らかにするためには角度を変えた研究 を行い確認を取ることが重要である.

t1の計算式の分母の式をみると, 

図28 値とは?

図27有意水準(危険率)とは?

*9この5%(0.05)を決めたのは,統計学では有名なRonald Fish- erと言われている.実は,0.05に科学的根拠はないのである.

Fisherが0.07と決めれば,そう決まったかもしれない.

*10第一種の過誤に対して,差があるのに対立仮説を棄却して,差 がないとしてしまう誤りを,第二種の過誤と呼ぶ.これらは統計 書によく登場し,わかりにくい単語である.

日本農芸化学会

● 化学 と 生物 

(9)

1+ 2

1 1 u n n  

nが大きくなればなるほど,この値が小さくなり,¯1

¯2と仮定すると,1値は大きくなることがわかる. 値 が大きくなると, 分布の端のほうに寄るので,有意と なる可能性が高まる.したがって,検定では,標本 データの大きさ を増やせば有意差は出やすい.微妙な 差しかない,あるいは,バラツキが大きいことが最初か らわかっているパラメータの場合に, を増やすことは 有益な手段である.

0.05をどのように表現するのか?

有意差をどのように表現するのかは図29に記載した とおりである.有意差があると,「差があった!」と表 現することが多いが,これまで述べてきたように,「差 がある」という表現は適切ではない.正確には,「有意 水準5%未満で統計的に有意差がある」が正しい.せめ て,「(統計的に)有意差がある」という表現を使うよう にしたい.また, >0.05の場合では,「(統計的に)有 意差はない」が妥当な表現である.

母集団の情報がわかっている場合の検定で統計的有 意差の意味を再度理解する!

読者は統計的有意差の意味が理解できたであろうか? 

かなり複雑な内容であったため,いま一つピンと来てい ないかもしれない.そこで,ここでは,生命科学研究者 が用いることはほとんどない母集団の情報(母平均µと 母分散σ2)がわかっている場合の検定について説明し,

有意差検定の理解を深めたい.すでに有意差の意味を理 解できた読者は,おそらく簡単に理解できるはずであ る.

筆者が作った架空の母集団であるが,日本人男性の身 長の分布を正規分布する母集団と考え,身長の平均(母 平均)がµ=170 cmで,母標準偏差σ=10であることが わかっていると仮定して考える(図30上)(通常の生命 科学系研究ではこの部分が不明であり,それを知りたい がために研究している).日本人男性は6,000万人いると する.分布は正規分布であるから,170 cm前後の人が 多く,身長がかなり高いおよび低い人の人数は減ってい くというベル型である(図30左上グラフ).ここで,

170 cm前後のヒトはたくさんいるので,「日本人男性と 同等と判断する」.一方で,身長が正規分布の両側のか なり外れたあたりにあると,170 cmからかなり外れて

おり,そのような身長の日本人は滅多にいないので,

「日本人と同等とは言えない」と判断する.これが有意 差がない,あるいは,あることを意味する統計検定の原 理である.

これまで,統計検定とはもともと差がないところから 考えていく.しかし,差がないというにはあまりにも差 が大きいので,差があることにしてしまおうと考えると 説明してきた.ここでもこの考え方は同様である.もと もと日本人である.しかし,日本人と考えるにはあまり にも背が高い(低い)ので,日本人とは言えないことに してしまおうという考え方である.

ここで,日本人と同等か,同等とはいえないかを判断 するための境界線として考えられたのが,有意水準の 5%あるいは1%である.6,000万人の5%は300万人であ る.両端それぞれで2.5%は150万人に相当する.かな り背が高い(低い)人で,この両端150万人に入ってい 図290.05の表現は?

図30母集団の情報がわかっている場合の統計検定の考え 方(1

日本農芸化学会

● 化学 と 生物 

(10)

れば,あまりにも背が高い(低い)ので,日本人とは同 等の身長ではないことにしてしまおうと考える.これが 統計検定での「有意差がある」ことを意味する.

さらに実例をあげると,今ここに,身長 1=194 cmの A君がいる.A君が日本人と同等の身長かどうかを調べ たい(A君は日本人かどうか不明とする).そのために,

194 cmがこの正規分布のどのあたりにあるのかを調べ ることとする.図30左の正規分布で,194 cmがどのあ たりにあるかを調べることもできるが,図18で述べた ことと同様に,µ=0, σ=1の標準正規分布に当てはめ,

データを標準化することに決まっている(図30右下). 平均値をゼロへ座標移動するために母平均µを引き,

σを1とするために,σで割り算する.すると,以下の式 ができる(図30右中央式). 

= 1

1 (x µ)

Z σ

µ=170 cm, σ=10であるから, 

= − =

1 (194 170)

10 2.4

Z  

となる.

標準正規分布で,両端2.5%に相当する 値は,1.96

(あるいは−1.96)と決まっている.計算値2.4は,1.96 よりもさらにゼロより遠い位置にあり(図30右下グラ フ),身長194 cmのA君はかなり外れた身長であること がわかる.したがって,A君は日本人の身長としてはか なり外れているので,日本人と同等の身長とは言えない と判断する(図30左下).ここで,「A君の身長は日本 人と同等である」は帰無仮説となり,「A君の身長は日 本人と同等とは言えない」は対立仮説となる.A君の場 合は,帰無仮説を捨て,対立仮説を採用する.これが有 意差検定である.

このように,A君は日本人にしてはあまりにも身長が 高いので,日本人とは同等の身長ではないことにしてし まおうと考えたのであって,決して日本人と同等ではな いと断定したわけではない.日本人でもこの身長の人は 存在する.実はA君が日本人であることはありうる.A 君が日本人ではないとは,決して断定できないのであ る.

A君の場合は,標本として =1であったが,標本が 複数の場合はどうなるのであろうか? たとえば,日本 全体の大学生の平均身長が,µ=170 cmで,母標準偏差 σ=10であることがわかっていると仮定する(母集団)

(図31.Y大学の無作為抽出した学生 =25の平均身長

は,¯2=174 cmであった.Y大学の学生の身長は,全 国平均よりも大きいと言えるかという設問があったとす る.ここで,帰無仮説は全国平均と同等である.対立仮 説は全国平均と同等とは言えないと設定する.

ここでは, =25の標本平均174 cmが焦点である.こ れは,日本人学生の母集団から25名を標本としてとっ た平均値(標本平均)である.そうすると,25名の標 本を取ることを繰り返して得られた標本平均の分布で考 える必要がある.これは,図17の設定と同じなので思 い出して欲しい.標本平均の分布は正規分布し,母平均 μを中心にバラつく.そのバラツキ(母標準偏差)は 

σn  

であった(図17および31中央グラフ).この正規分布 で,¯2=174 cmがどこにあるかを考えるが,何度も説 明してきたように,ここでも標準正規分布に標準化する

(図18および31の式).そうすると,変換式は以下とな る.得られた値を 2とすると, 

2 2 174 170

10 2 25 Z X µ

σn

= = =  

となる(図31右グラフ).

そこで, 2=2が標準正規分布のどの位置にあるかを 調べる.先程記述したように,両端2.5%のときの の 値は,1.96であるから,2は1.96よりも僅かに大きいの で,Y大学の学生の身長は,ぎりぎり全国平均と同等と は言えず,有意に背が高いという結論となる.統計学で はこのような考え方をすることを再度認識して欲しい.

ここでもし標本の大きさ が25名よりも小さいと,

図31母集団の情報がわかっている場合の統計検定の考え 方(2

日本農芸化学会

● 化学 と 生物 

(11)

上式の分母  σn は大きくなるため,

2の計算値は1.96 よりも小さくなる.そうすると統計的有意差はなくな り,Y大学の学生は全国平均と同等と言えるという結果 になる.つまり,標本の大きさ が小さくなると結論が 変わる. が小さくなると,情報の正確さに欠けてくる ので,全国平均と同等と言わざるをえなくなってくるの である.

ここで,先程のA君 =1の例に戻るが, の変換式 は以下であった. 

σ

= 1

1 (x )

Z µ

一方,Y大学の学生25名の例では, 

σ

= 2 Z2 x µ

n  

であった.この 2の式に =1を入れれば, 1と同じ式 であることに気づく.すなわち,図31の中央グラフは,

=1の場合は,左グラフと一致する.

ここでは,母集団の情報がわかっているので,標準正 規分布で検定を行ったことを理解して欲しい.すでに述 べたt検定では,母標準偏差σがわからないために,仕 方なく不偏標準偏差uを用いざるをえず,そのために,

t分布が登場した(図25).違いはこの部分のみである.

対立仮説の立て方で検定結果は異なる!(図32 これまで2群の実験で,同一母集団からの標本で2群 とした.2群それぞれの母平均は便宜的にμ1とμ2とした

(同一母集団であるからμ1=μ2である).帰無仮説とし て母平均μ1とμ2は差がない,すなわち,μ1=μ2とした.

μ1とμ2はどちらが大きな値になるかは,通常はわから ない.そこで,対立仮説はμ1≠μ2(すなわちμ1−μ2≠ 0)とした.標本平均 ¯1と ¯2で考えると,( ¯1‒ ¯2)は プラスかマイナスかわからない.したがって, 分布の 両端の2.5%ずつの範囲に入れば,有意水準5%で有意差 ありとする.このような検定を両側検定と呼ぶ(図 32).未知の機能性成分の影響を調べる場合では,通常

¯1と ¯2はどちらが大きくなるかわからないので,両側 検定とすべきである.しかし,前もってμ1とμ2のどち らかが大きいという十分な情報がある場合は,μ1>μ2あ るいはμ1<μ2と対立仮説を立てることも可能である.

具体的な例を図32左下に記述している.もし,μ1<μ2

と対立仮説を立てることができれば,( ¯1‒ ¯2)はマイ

ナスとなることが最初から期待できることから,図32 の 分布グラフのマイナス側だけを考えればよいので,

マイナス側に5%を設定できる.このような検定を片側 検定と呼ぶ.図32右下図を見るとわかるように,片側 検定では両側検定よりもマイナス側の 分布の面積が2 倍となるので,有意となりやすくなることがわかる.

片側検定を使えるのは十分な証明のある場合である.

図32に片側検定の一例を示した.しかし,一般的な生 命科学系の研究では十分な立証がないから研究を行って いる場合が多いので,生命科学系の研究において片側検 定を用いることはほとんどない.なお,ある試験物質で 1, 2回実験を行ってみて両側検定で有意な影響が得られ たからといって,それ以降の少し条件を変えた実験にお いて,片側検定を用いて有意差を得やすくするといった 判断は許されることではない.あくまでも,μ1とμ2の どちらかが大きいという十分な情報がある場合に限られ る.原著論文において,一般的には両側検定か片側検定 かの記述はないが,常識的には両側検定を行っているは ずである.統計ソフトでは,片側か両側かをチェックし て検定に進む場合が多いので,間違えないようにしなけ ればならない.もし,チェックせずに進む統計ソフトが ある場合は普通は両側検定が行われる.

2群のパラメトリック検定の流れ

図33に2群のパラメトリック検定の流れを記載してい る.これまで述べてきたのは,対応のない独立2群の検 定 unpaired   testであり(図33左端の上から下の流 れ),同一母集団からの標本なので,母分散は等しい,

すなわちσ12σ22と仮定した(2群の差の検定(Student の 検定の項参照)).しかし,標本として2群をとって 図32対立仮説の立て方

日本農芸化学会

● 化学 と 生物 

(12)

いるので,たまたま,分散が等しいとはいえない場合も 起こりうる.分散が等しい,すなわち,等分散かどうか は,等分散性の検定を行い,等分散と判定されれば,

unpaired   testを行い,等分散と判定されなければ,

Welchの検定を行うというのが定番で,多くの統計書に そのように書かれている(図33左上から下への流れ). しかし,Welchの検定は,等分散でない場合だけでな く,等分散かどうかわからない場合でも正確な検定がで きることから最近では推奨されている.一方,unpaired 

 testは,等分散から外れると検定が不正確となる.つ まり,Welchの検定を用いるのであれば,等分散性の検 定を行う必要がない.unpaired   testは2群の検定の定 番のように言われてきたが,t検定を指定すると,実際 はWelchの検定が実行される統計ソフトも現れている.

まず,等分散性の検定について説明する.

等分散性の検定( 検定)の原理(図34

すでに述べてきたが,unpaired   testは,同一母集団 から2群の標本を取り,それぞれの母分散を便宜的にσ12

σ22としたとき,同一母集団であれば当然σ12σ22で あるから,2群の分散は等しい(等分散)として検定が 考えられている.しかし,実際には,得られるのは標本 データであり,母分散はわからないので,2群の不偏分 散u12とu22で考えざるをえない.標本データであるか ら,u12とu22が必ずしも近い値になるわけではなく,か け離れてしまうこともありうる.そうすると,unpaired 

 testではうまく検定できない.そこで,u12とu22がか け離れているかどうかを検定する方法として等分散性の 検定がある.この検定は, 検定とも呼ばれる.

図34上図にあるように,同じ母集団から2群を取り出 し,それぞれの不偏分散u12とu22を計算する.等分散で あれば,u12=u22を考えればよい,u12=u22であれば,

u12/u22は1になる(この値を とする).u12とu22がか なり離れた値なら,u12/u22は1から外れた値になる.こ れを利用する.そこで,母集団から2群を取って, 値 を計算することを何度も繰り返してプロットすると,あ る分布が出現する(図34右グラフ).これを 分布と呼 ぶ*11.u12/u22の分布であるから,マイナスはありえな い. は1前後になる可能性が最も高いので,1をピー クにして,1から離れるほど少なくなる分布となる.そ

こで, が1あたりにあると等分散と考え(図34中 1前 後),1から大きく離れた場合(図中 23前後),等 分散と考えるにはあまりにも離れており,無理があると 判定する.その判定基準であるが, 検定の場合と同様 に考える.すなわち,全体の5%を基準に考える.u12と u22はどちらが大きい値になるかはわからないので,

値は,1より大きくなるか小さくなるかわからない.そ こで,両端の2.5%ずつを基準とし,そこに 値が入っ た場合,等分散とは言えないと判定することにしようと いう考え方である.これが,等分散性の検定の原理であ る*12

しかしながら,標本の大きさ が小さいと,不偏分散 が大きくばらついてくる恐れがあるので,u12/u22も大 きく変動し,等分散かどうかの判断が難しくなる. が

*11 分布は自由度により形が変動する.ここでは2群あるので,

第1群目を分子とし,2群目を分母とすると,自由度 1−1と 2−1 の 分布となる.なお,図34のF分布の図は筆者が適当に描いた もので正しい図ではない.

図332群のパラメトリック検定の流れ

図34等分散性の検定

*12検定でも述べたように,同じ母集団から考えてきたことから,

等分散ではないと断定することはできないことはおわかりいただ けるはずである.

日本農芸化学会

● 化学 と 生物 

(13)

小さい場合,等分散性の検定では等分散と判断されるこ とが多い.これは等分散ではないと判断するにはばらつ きが大きすぎるため,等分散と判定しているにすぎな い.等分散かどうかの判断は,一般的に =30以上必要 とされる.これらのことから,標本の大きさ が小さい 場合は等分散性の検定はあてにならないのである.

そうすると, が小さい場合に等分散と判定されて も,unpaired   testを行うのは危険かもしれない.生命 科学系の研究では, が30よりも小さい実験が多いので はないだろうか? このような場合,Welchの検定を選 択したほうが妥当と考えられる(Welchの検定は次項で 説明する).もちろん, が大きい場合でもWelchの検 定は使えるので,結局,標本の大きさ にかかわらず,

等分散性の検定は行わず,Welchの検定を行えばよい.

なお,この検定の流れは比較的最近推奨されてきている が,まだ広く認められたわけではなく,等分散性の検定

→unpaired   testという考え方で書かれた本がほとんど である.この議論に関してネット上にまとめられてい る(3).検定を利用するだけの研究者にとって,この論争 は迷惑であり,どちらかに決めてほしいところである.

筆者が調べたかぎりでは,等分散性の検定は行わず,

Welchの検定でよいと考えられる.この考え方で,図 33を修正したのが,図35である.

統計ソフトでは,等分散性の検定ののちにunpaired    testとWelchの検定の両方の検定結果が表示されるもの がある.両者で検定結果が同じであればその結果を採用 すればよいので何も問題がない.しかし, が小さい場 合,もし,unpaired   testとWelchの検定の検定結果が 異なると困ったことになる.等分散性の検定があてにな らないと,どちらの検定結果を採用してよいか決められ ない.このような場合は,Welchの検定の検定結果を採

用してよいと考えられる.

Welchの検定の考え方(図36

Welchの検定の考え方は,unpaired   testの考え方と よく似ているが,分散が異なるかもしれない2群で考え るので,母分散の異なる2つの母集団からそれぞれ標本 をとって2群としたと考えたほうが,考えやすい(図36 左上図).つまり,母平均μは同じであるが,母分散は 異なる2つの母集団からの標本と考えるのである.便宜 的に2つの母平均はμ1とμ2とするが,μ1=μ2である.

それぞれの標本平均を ¯1と ¯2とし,( ¯1‒ ¯2)を計算 する.これを何度も繰り返して分布を調べると,un- paired   testの場合と同様に正規分布する(図36右下グ ラフ)*1.このとき,母分散σ12およびσ22は異なるので,

以下の式のように,別々に足すことで合算の母分散を求 める. 

2+ 2

1 2

1 2

n n σ σ

これをルートした値が母標準偏差となる(図36右下 グラフ). 

+ 2

2 2

1

1 2

n σn σ

そ こ で,unpaired   testの 場 合 と 同 様 に,( ¯1‒ ¯2) を標準正規分布の値に標準化する(図36右下グラフか ら中央下グラフへ).

そうすると,以下の式が出現する(標準化の方法につ いては図18参照).これにより,( ¯1‒ ¯2)は標準正規 図35修正版:2群のパラメトリック検定の流れ

図36Welchの検定の考え方

日本農芸化学会

● 化学 と 生物 

(14)

分布の 1へ変換される(図36中央下グラフ). 

1 2 1 2

1 12 22

1 2

( – )–( – )X X Z

n n σ σμ μ

= +

unpaired   testの場合は,以下の式であった(図25). 分母の標準偏差の違いを認識して欲しい. 

1 2 1 2

1

1 2

( – )–( – ) 1 1 Z X X

n n μ μ

= σ

+

ここで,μ1=μ2であるから,分子の(μ1−μ2)はゼロ となり消すことができる.また,σ12およびσ2 はわから ないので,それぞれの群の不偏分散u12とu22を用いるこ ととなる.

unpaired   testでは,図26にあるように,合算の不 偏分散を計算した.これは2群がそれぞれ等分散である と仮定したので,合算した.しかし,Welchの検定で は,2群の母標準偏差が異なるので,それぞれの群の不 偏分散u12とu22をそのまま代入する.そうすると,標準 化の式の分母は以下の 1の式となる. 

1 2

1 12 22

1 2

( – )X X t u u

n n

= +

この 1値が, 分布のどこにあるかを調べる(図36左 下のグラフ).

このように,( ¯1‒ ¯2)を標準正規分布に標準化する が,母標準偏差がわからないので不偏標準偏差に置き換 えることでt分布となり,1値がt分布のどこにあるかを 考えるという手順はunpaired   testの場合と同じである ことがわかる.

ただし,unpaired   testでは,自由度は2群の自由度 を足した( 1−1)+( 2−1)であった.つまり自由度

12−2)の 分布を用いる.しかし,Welchの検定 では,自由度が異なる.自由度の計算式は以下のような 複雑な式となっている. 

 

 + 

 

 

=    

   

   

  + 

− −

自由度

2 2 2

1 2

1 2

2 2

2 2

1 2

1 2

1 1 2 1

u u

n n

u u

n n

n n

自由度については,すでに説明した*7.しかし,この 計算式がどのように誘導されたのか,また,なぜこの自

由度の 分布を用いれば適正に検定できるのかは原報を 読んでも理解できず,筆者の能力を超える(4).この自由 度は整数にはならないので,四捨五入して整数にして,

その自由度の 分布を用いることとなる.統計ソフトで は自動的に計算してくれ,その 分布に当てはめてくれ る.その後の手順は,unpaired   testと同様に検定する

(図27).

unpairedpaired   testはどう違うのか?(図37

これまでは,対応のない独立2群の差の検定(un- paired   test)を述べてきたが,対応のある関連2群の 差の検定(paired   test)もある.わかりやすい例を図 37に記載した.2群の別々のネズミで試験すると,ネズ ミは対応していないので対応のない独立2群の検定であ る.一方,同じネズミで投与前と投与後の比較をする場 合 は,対 応 が あ る の でpaired   testと な る.paired    testの考え方は,これまで述べてきたunpaired   testを 理解していれば容易に理解できる.

簡単に記すと,paired   testの場合には,同じネズミ からのデータなので,投与後のデータ 1と投与前の データ 2を個々のネズミで比較できる.そこで,仮に6 匹のネズミがいるとして,それぞれのネズミで差 = 1

2を計算する.投与前と投与後で大きな変化がなけ れば はゼロの前後に分布することになり,何らかの影 響があれば, はゼロから離れる.パラメトリック検定 であるからもともとの母集団は正規分布と仮定してお り,差 もまた正規分布することが知られている.そこ で,6匹の の平均値(標本平均) とその不偏標準偏 差を計算する.その後は, を標準正規分布に標準化 図37unpairedpaired   testの違い

日本農芸化学会

● 化学 と 生物 

Referensi

Dokumen terkait

る。2年目,仕事の関係で近隣の日本語学校の留 学生や日本語教師に留学生活の話をする経験をす る。自分で他者に働きかけること,自分のことを 語ることが他者の人生に意味があり,助けになる という自覚,自分の経験の価値を自覚するように なった(「日本社会で有能な自己」の自覚)。3年 目の異動で日本語のみで仕事をこなすようになっ た仁子さんは,次第に日本語で仕事をすることに

横内 光子 [実務経験のある教員による授業] 〇 [ 到達目標 ] 1.自らの研究課題に応じた研究方法論について検討し、研究計画書を作成することができる。 2.研究倫理に基づいて研究を実施することができる。 3.データ収集・分析を行い、結果および考察を多角的に検討することができる。