• Tidak ada hasil yang ditemukan

5章 2群間の量的データの検定 【動画】

N/A
N/A
Protected

Academic year: 2024

Membagikan "5章 2群間の量的データの検定 【動画】"

Copied!
8
0
0

Teks penuh

(1)

5章 2群間の量的データの検定 【動画】

5.1 対応のない検定手順

例えば、男女の成績を比較しようとして試験を実施した場合、男性の集団(群)と女性 の集団(群)との比較になりますから、2つの集団に同一人物はいません。しかしその試験 で英語と国語の平均点を比較する場合、英語と国語を受験した集団には必ず同じ人がいま す。前者のような場合を対応のないデータ、後者の場合を対応のあるデータと呼びます。

対応のあるデータについては特別の処理ができるので、章を変えて説明しますが、対応を 考えず単純に2つの集団として処理することも可能です。ここでは対応のない2つの集団 間の平均値と中央値の比較について見てみましょう。

対応のないデータについての検定手順は以下の図の四角形の中で表されます。

図5.1.1 量的データ検定メニュー

この手順はまず2群のデータに正規性があるかどうか調べます。もし2群とも正規性があ れば、次の等分散性の検定に進みます。片方でも正規性がなければ、検定方法はWilcoxon の順位和検定となります。等分散性の検定ではF検定と呼ばれる検定方法を利用します。

これでもし等分散性ありとなれば検定方法はt検定、等分散性なしとなれば検定方法は

Welchのt検定になります。それでは各検定を具体的に見て行きましょう。

5.2 対応のない2群間の分散の検定(正規性あり)

データの正規性の判定方法については前章で説明しましたので、ここではこの部分の説 明は省略します。データに正規性が認められた場合、次の検定は等分散性の検定です。以 下の例を見て下さい。

A機を導入した会社 18 社(1群)とB機を導入した会社 15 社(2群)について、機械 10台当り1年間の故障発生件数を調べ、不偏分散を求めたら以下の結果を得た。

1群 10.68 2群 3.17

分布は正規分布であると仮定して、分散に差があるといえるか有意水準5%で判定せよ。

(2)

まず、量的データ検定メニューの「等分散性の検定」ボタンをクリックして、以下の F 検 定メニューを表示します。データはもうすでに集計していますから、ラジオボタンは「集 計から」にし、データ数と不偏分散の値を入力します。

図5.2.1 等分散性の検定メニュー

その後、「検定」ボタンをクリックすると以下のような結果出力画面が表示されます。

図5.2.2 等分散性の検定結果画面

これを見ると有意水準5%で「2群の分散間に差があるといえる」という結論になっていま す。言葉を変えて「等分散性なし」というような表現も加えてあります。片側確率がp>0.05 の場合は、「2 群の分散間に差があるといえない」という結論と「等分散性ありとみなす」

という表現が併記されます。通常異分散でない場合、等分散とは結論づけられませんが、

このような検定の場合は等分散とみなして次の処理に移ることが多いようです。

この検定に使った理論式を書いておきましょう。

理論 F検定

母分散に差がないとすると

1 , 2 1

2 2 1

2

~

1

= F

n n

u

F u

分布

5.3 対応のない2群間の平均値の検定(正規性あり・等分散)

次の検定は、正規性があって等分散性もある場合です。検定はt検定を利用します。以下 の例を見て下さい。

ある地域の同性・同年齢の児童について、ある要因の有無による2つの集団の体重を調

(3)

べたところ以下のデータを得た。2つの集団の平均値に差はあるといえるか。正規性、等 分散性を仮定して、有意水準5%で判定せよ。

データ数 平均 不偏分散 要因なし 20 40.2 25.5 要因あり 20 36.4 16.0

正規性と等分散性を仮定していますから、量的データ検定メニューの分析の選択はt検定に 到達します。「t 検定」ボタンをクリックして、以下の検定メニューを開きます。ラジオボ タンは「集計から」にし、画面下の集計データ記入欄に上の情報を書き込みます。

図5.3.1 t検定実行画面

「検定」ボタンをクリックすると以下のような検定結果が表示されます。

図5.3.2 t検定結果表示画面

検定の両側確率が0.0142<0.05となり、2群の平均値間に差があるといえるという結論にな ります。

この検定に利用した理論は以下の通りです。

理論(studentの)t検定 母平均に差がないとすると

2

2 1

2 2 2 2 1 1

2 1 2

1 2 1

2

~

1

2 ) 1 ( ) 1

(

+

− +

− +

= + t

n n

n n

u n u n

x x n

n n

t n

分布

5.4 対応のない2群間の平均値の検定(正規性あり・等分散性なし)

次は正規性があっても、等分散性がない場合の平均値の差の検定です。5.2節の例の続き と思って下さい。以下の例をご覧下さい。

(4)

A機を導入した会社 18 社(1群)とB機を導入した会社15 社(2群)について、機械 10台当り1年間の故障発生件数を調べ、平均と不偏分散を求めたところ以下の結果を得た。

正規性があり、異分散であるとして、2群間の平均に差があるかどうか有意水準5%で検定 せよ。

平均 不偏分散

1群 10.56 10.68

2群 8.22 3.17

このデータはA機の会社とB機の会社で正規性があり、分散が異なると仮定されていま すので、量的データの検定メニューをたどるとウェルチ(Welch)のt検定が選択されます。

そこで「Welch の t 検定」ボタンをクリックすると以下のような分析画面が表示されます。

ここでもラジオボタンは「集計から」にして、下の集計データの入力部分に上で与えられ たデータを入力します。

図5.4.1 Welchのt検定分析実行画面

この分析画面で「検定」ボタンをクリックすると、以下の検定結果が表示されます。

図5.4.2 Welchのt検定結果画面

これによると両側検定確率p = 0.0146<0.05で、2群の平均値間に差があるといえるとなりま す。

ここで検定に利用した理論は以下の通りです。

理論 Welch(ウェルチ)のt検定 母平均に差がないとすると

2 2 2 1 2 1

1 2 1

n u n u

n c u

= +

として、自由度を

1 ) 1 ( 1

1

2 2

1 2

− + −

=

n c n

d c

とし、

(5)

t

d

n u n u

x

t x ~

2 2 2 1 2 1

2 1

+

= −

分布

問題(テキスト5.txt, 1頁)

ある1人当りの売上のデータについて、2つの地域の支店を比較したところ、以下の結果 が得られた。2群間に差があるといえるか。有意水準5%の両側検定で判定せよ。

1群 2007, 2344, 2434, 2251, 2673, 1452, 2393, 2126, 2485, 1279, 2269 2群 2579, 2899, 2258, 3086, 2998, 2829, 2408, 2287, 3020, 1989, 2136 検定名[ ] 確率[ ]

判定 母平均(母集団の中央値)に差があると[いえる・いえない]

問題解答

データの種類は「群別データから」です。

検定名[ t検定 ] 確率[ 0.0228 ]

判定 母平均(分布)に差があると[いえる・いえない]

5.5 対応のない2群間の中央値の検定(正規性なし)

ここでは 2 群のデータのどちらともかどちらかのデータに正規性がない場合の処理の方 法を学びます。以下の例をご覧下さい。

ある1人当りの売上のデータについて、2つの地域の支店を比較したところ、以下の結果 が得られた(テキスト5.txt, 2頁)。2群の売上は1群のそれに比べて大きいといえるか。有

意水準5%の両側検定で判定せよ。

1群 2060, 2350, 1550, 1720, 1800, 1990, 1510, 1720, 2910, 1820, 2600 2群 1720, 2064, 2072, 2005, 2602, 1987, 1824, 2060, 2035, 1890, 2025

データの種類は「群別データから」です。正規性の検定を行うと片方が正規性なしと判 定されますので、正規性がないデータとして、量的データの検定メニューをたどって、

Wilcoxon(ウィルコクソン)の順位和検定を選択します。「Wilcoxonの順位和検定」をクリ

ックすると以下の分析画面が表示されます。

図5.5.1 Wilcolxonの順位和検定分析画面

「検定ボタン」をクリックすると以下の結果が表示されます。

(6)

図5.5.2 Wilcoxonの順位和検定分析結果

Wilcoxon の順位和検定は、後に述べるようにデータの大きさの順位を利用する検定ですの

で 2 群の平均値を比べる検定ではありません。ここで比べるのは中央値で、この結果によ ると検定の両側確率はp = 0.3403>0.05ですので、「2群の中央値間に差があるといえない」

ということになります。何を比べているのかはっきりさせずに「2群間に差があるといえな い」というように表現する場合もあります。

解答

0.3403 0.05

p=  より、中央値に差があるといえない。

概要 Wilcoxonの順位和検定 【Skip OK】

Wilcoxon の順位和検定について簡単に説明しておきます。今データを白丸で表した 1群

と黒丸で表した2群の2つの群を考えます。下図の上のデータ並びをケースAと下のデー タ並びをケースBと呼び、状況の違う2つのケースとします。さてどちらのケースの中央 値が異なっているように感じるでしょうか。

3 4 5 6 7 8

2 1

8 7 6 5 4 3 2 1

図5.5.3 Wilcoxonの順位和検定の考え方

上は白と黒が混ざっていますから、下のケースの方が 2 つの群が分離しているように感じ ます。この感覚をどのように表現するのでしょうか。

今左から順番に番号を付けて行き、白丸と黒丸とでその番号の合計を取り、以下の表を 作ります。

表1 順位和

白丸群 黒丸群 ケースA 19 17 ケースB 11 25

この表を見ると、ケースA では白丸群と黒丸群はほぼ同じ順位和ですが、ケースBでは2 つの群で順位和はかなり違います。この違いを利用して 2 群の中央値を比較する検定を

(7)

Wilcoxonの順位和検定といいます。具体的には以下の通りです。

注)厳密にいうと、中央値だけを比較しているのではありません。

理論

両群のデータの小さい順に順位を付け、データ数の少ない群(

n

1

n

2)の順位和を

W

と する。但し、同じ値のデータにはそれらが異なると考えた場合の順位の平均値を付ける。

例えば同順位の3位には(3+4)/2=3.5の順位を付ける。

データ数が多い場合 両群の中央値が等しいとすると

~ ( 0 , 1 )

12 / ) 1 (

2 / 1

| 2 / ) 1 (

|

2 1 2 1

2 1

1

N

n n n n

n n n z W

+ +

− +

+

= −

分布(正の部分) (Yatesの連続補正)

データ数が少ない場合 数表を利用する。

ソフトを利用する限りこの理論を意識することはありませんが、同順位の処理については あくまで近似ですので、特に同順位が多い場合には注意が必要です(ソフトでは正確な計 算がなされています)。

問題1

以下の標本データ(Samples¥テキスト5.txt)の母平均(母集団の中央値)には差があるとい えるか。検定を選んで有意水準5%で判定せよ。

1群 112, 106, 101, 112, 102, 98, 108, 95, 101, 90, 110, 97, 95, 105, 101, 113, 114, 91 2群 98, 88, 105, 99, 96, 93, 109, 106, 103, 87, 107, 102, 97, 91

検定名[ ] 確率[ ]

判定 母平均(母集団の中央値)に差があると[いえる・いえない]

問題2

以下の標本データの母平均(母集団の中央値)には差があるといえるか。検定を選んで

有意水準5%で検定せよ。

1群 358, 469, 397, 350, 329, 446, 393, 379, 443, 348, 455, 332, 311, 424, 420, 354, 353, 390, 434, 430 2群 335, 387, 385, 343, 394, 351, 404, 391, 330, 363,

319, 334, 348, 396, 408, 403, 415, 353, 377, 399

検定名[ ] 確率[ ]

判定 母平均(母集団の中央値)に差があると[いえる・いえない]

問題3

ラットの体重増加(g)を、条件を変えた2つのグループで測定したところ、以下の結果が得 られた。2群の体重増加に差は認められるか、有意水準5%で判定せよ。

(8)

1群:7.2, 8.3, 5.4, 6.0, 7.3, 11.7, 10.5, 8.0, 9.1

2群:10.1, 13.2, 7.4, 9.1, 16.2, 14.5, 6.3, 11.2, 12.4, 7.4, 12.5, 9.1, 17.0 検定名[ ] 確率[ ] 判定 体重増加に差があると[いえる・いえない]

問題4

Samples¥テキスト9.txtのデータを用いて以下の問いに答えよ。

1)地域別の年収に差があるか、検定を選んで有意水準5%で判定せよ。

検定名[ ] 確率[ ] 判定 地域別の年収に差があると[いえる・いえない]

2)地域別の支出に差があるか、検定を選んで有意水準5%で判定せよ。

検定名[ ] 確率[ ] 判定 地域別の支出に差があると[いえる・いえない]

3)意見1別の年収に差があるか、検定を選んで有意水準5%で判定せよ。

検定名[ ] 確率[ ]

判定 意見1で答え方が違う人で年収に差があると[いえる・いえない]

問題1解答

検定名[ t検定 ] 確率[ 0.1217 ]

判定 母平均(母集団の中央値)に差があると[いえる・いえない]

問題2解答

検定名[ Welchのt検定 ] 確率[ 0.1401 ]

判定 母平均(母集団の中央値)に差があると[いえる・いえない]

問題3解答

検定名[ t検定 ] 確率[ 0.0246 ]

判定 体重増加に差があると[いえる・いえない]

問題4解答

1)地域別の年収に差があるか。

検定名[ Wilcoxon順位和検定 ] 確率[ 0.0884 ] 判定 地域別の年収に差があると[いえる・いえない]

2)地域別の支出に差があるか。

検定名[ t検定 ] 確率[ 0.1184 ]

判定 地域別の支出に差があると[いえる・いえない]

3)意見1別の年収に差があるか。

検定名[ Wilcoxn順位和検定 ] 確率[ 0.3823 ]

判定 意見1で答え方が違う人で年収に差があると[いえる・いえない]

Referensi

Dokumen terkait

書評 慣習と創造活動の間で 『考えるための日本語』を読んで Between Convention and Creativity 佐藤 慎司∗ 出典:細川英雄+NPO法人「言語文化教育研究所」スタッフ(2004).『考えるための日本語――問題を発 見・解決する総合活動型日本語教育のすすめ』明石書店. 言語,文化を教えるものにとって言語,文化のよ

16 私の合格体験記 化学(20年度) 化学受験を考えている方へ ※こちらは21年度ではなく、20年度入学の方の体験記になっております。 はじめに はじめまして! 心理学類 2 年の堀です。ここでは筑波大学の化学受験を少しでも考え ている方に向けて、私の体験談をお話ししたいと思います。 なぜ化学を選んだのか

合格体験記 英語 6 英語からは逃げられない、諦めろ。 こんにちは。心理学類2年の片岡です。僭越ながら、英語の合格体験記を書かせていた だきます。タイトルを見て何となく察しはつくと思いますが、私はあまり英語が得意では ありません。この体験記が、英語に苦手意識がある方の参考になれば幸いです。 基礎固め

新型 コ ロ ナ ウ イ ルス 感染 症罹 患又 はそ の疑 いのあ る 受検 者へ の対 応フ ロ ー チ ャ ー ト ※このフローチャートは一般的な対応を示したものです。個別の状況等によってはこれと異なる対応をする場合がありますので、新型コロナウイルス感染症に罹患した場

『日本貿易学会研究論文(リサーチペーパー)』投稿規程 3.投稿論文の使用言語は日本語または英語とする。日本語の場合は 15,000字以上20,000字以内、英語の場合は5,000語以上7,000語以内とす る。但し、大量のデータや資料を伴う場合は、研究委員会の判断によって合計 30,000字(英語の場合は10,000語)を限度として認めることがある。

二重測定が超過する要因の考察 0 10 20 30 40 50 60 0 20 40 60 変動率% 質量濃度(μg/m3) 二重測定試験で一方の捕集に不具合がある場合、2つの質量濃度の間 に差が生じると考えられる。 ⇒ ⇒⇒ ⇒質量濃度の差が大きい事例を抽出 ⇒各元素の二重測定結果を整理し、捕集時の誤差要因を考察(次頁)

熊本大学 数理科学総合教育センター 不偏推定量 , 一致推定量 , 最尤推定量 演習問題2 母数θの母集団からの標本をX1, X2,.. , Xn とする.ここでは統計量,推定量,推定量の不偏 性,一致性を次の意味で用いる.

最頻ひん値 mode 度数分布で最も頻度の高い値を最頻値 またはモードといいます。Excel にも最頻 値を求める関数があります。 最頻値 = mode範囲 しかし、この関数を利用するときには注意 が必要です。例えば1, 2, 4, 5, 6, 6というデ ータで最頻値を求めてみます。このデータだと6 が2 つ、他は1 つですから、最頻値は6