• Tidak ada hasil yang ditemukan

PDF 6章 相関係数の検定と回帰分析 - 福山平成大学

N/A
N/A
Protected

Academic year: 2024

Membagikan "PDF 6章 相関係数の検定と回帰分析 - 福山平成大学"

Copied!
8
0
0

Teks penuh

(1)

6章 相関係数の検定と回帰分析

この章では2つの量的なデータの関係を調べる検定手法を学びます。2つの量的な データを表示するには散布図がよく用いられ、描画された点の散らばり方によって、

相関係数が計算されました。この相関係数はピアソン(Pearson)の相関係数と呼ばれ、

2つのデータの間の線形の(散布図では直線的な)関係を調べるものでした。しかし、

一般に関係は線形なものとは限らず、非線形な(散布図では曲線的な)関係も多く見 られます。我々はこのような関係も考える必要がありますが、このように非線形な、

但し大小関係だけは考えた、相関係数にスピアマン(Spearman)の順位相関係数があ ります。これは2つの変数の大きさの順位を用いた相関係数です。我々はこれらの2 つの相関係数を使って、相関の有無を調べることにします。

6.1 (Pearsonの)相関係数

ここではPearsonの相関係数が、統計的に0と異なるかという検定を紹介します。但 し、2つのデータが2変量正規分布に従う場合にこの検定は有効です。2変量正規分布 の検定についてはCollege Analysisにありませんので、散布図でデータがラグビーボー ル状に描画されており、各変数に正規性がある(正確にはないことはない)ことを調 べればよいでしょう。形が歪んでいたり、どちらかまたは両方の変数に正規性がなか った場合には次節で述べるスピアマンの順位相関係数を用います。分析メニューは[分 析-基本統計-相関と回帰分析]を選択して、図6.1.1のメニュー画面を表示します。

図6.1.1 相関と回帰分析メニュー画面

(2)

最初にピアソンの相関係数の検定を行います。以下の例を見て下さい。

2つの商品A, Bの地域別使用率 (%) のデータは以下の通りである。それぞれの商 品の使用率に線形の相関が認められるか。正規性を仮定して、有意水準5%で検定せよ。

A(%) 33 24 30 50 42 15 15 56 13 45 44 21 18 31 27 40 B(%) 20 34 50 20 58 23 12 34 26 56 42 5 25 51 19 27

ファイル Samples¥テキスト 6.txt を開いて、最初のページですべての変数を選択し、

「相関係数」コマンドボタンをクリックして、図6.1.2のような結果を得ます。

図6.1.2 ピアソンの相関係数の検定画面

相関係数は0.45を超えていますが、ここではデータ数が少ないために相関係数は0と 比べて有意差が見られません。もう少しデータを集める必要があるようです。

2 つの変数間に関係があると考えられるのは、ある程度相関係数の絶対値が大きく

(必然性はありませんが、前に述べたように0.5程度から)、なおかつ検定結果に有意 差が見られるような場合とする必要があります。ここで使った検定手法は以下の通り です。

(3)

母相関係数を0と仮定して以下の性質を利用する。

2 ~ 2

1 2

  tn r n

t r 分布

6.2 (Spearmanの)順位相関係数

今度は前節のデータをもう一度利用して、正規性を仮定せずに相関を見てみましょ う。

前節の問題で、それぞれの商品の使用率に相関(非線形のものも含む)が認められ るか。正規性を仮定せずに、有意水準5%で検定せよ。

「順位相関係数」ボタンをクリックすると図6.1.3の検定結果が得られます。

図6.2.1 スピアマンの順位相関係数の検定画面

ここで使った検定手法は以下の通りです。

理論

順位相関係数

r

s を求め、母相関係数を0と仮定して以下の性質を用いる。

(4)

2 ~ 2

1 2

  n

s

s t

r n

t r 分布

ところで本当はどちらの検定を考えるべきでしょうか。図6.1.4のように散布図を描き、

図6.1.5のように正規性の検定を行います。

図6.2.2 散布図の描画

図6.2.3 正規性の検定 これからピアソンの相関係数で調べることが分ります。

(5)

6.3 回帰分析

回帰分析の簡単な意味は、1.2節で説明しましたが、ここでは回帰式の検定について 話をします。回帰式には、回帰係数が 0 かどうかを調べる検定と回帰式の残差の変動 と回帰式の変動(回帰変動)とを比べる回帰式の有効性の検定があります。回帰式の 有効性の検定では、回帰変動が残差変動より有意に大きい場合に回帰式は有効である いうことになります。これらの検定は一般には別物ですが、説明変数が1つの回帰式 の場合、回帰直線の傾きを表す回帰係数の検定は回帰式の有効性の検定と一致します。

またこれらの検定を利用するためには、残差の分布に正規性が必要なことは忘れられ がちな性質です。それでは例を見てみましょう。

下の表のデータを用いて、身長により体重を推定する式を考える。ただし、式は1 次式(体重 =

a×

身長 +

b

)と仮定し、その有効性を検討せよ。

体重 71 68 67 72 69 80 75 65 74 71 身長 169 175 170 179 176 174 173 181 179 178 体重 62 75 70 70 62 58 60 58 59 73 身長 170 180 177 175 172 166 168 173 169 170

Samples¥テキスト6.txtのデータを開いて、目的変数、説明変数の順番に、体重、身長

と変数選択し、図6.1.1のメニューで「回帰分析」ボタンをクリックします。結果は図

6.3.1のように表示されます。

(6)

図6.3.1 回帰分析結果

分析結果は、最初に回帰式が表示されます。次に重相関係数とその 2 乗である寄与 率です。寄与率は決定係数とも呼ばれ、データの全変動のうちの何%が回帰変動で表 されるかを示しています。そのためしばしば%で示されることがあります。また、重 相関係数は目的変数の予測値と実測値の相関係数で、1説明変数の回帰分析の場合は 通常の相関係数に一致します。

次は、回帰式の有効性や回帰係数の検定ができるための、残差の正規性の検定結果 が表示されています。ここでは数値的なS-W検定(大まかな近似)の結果が参考のた めに示されています。残差の正規性が否定されなければ、回帰式の有効性や回帰係数 の検定が利用できます。ここでは回帰式は有効であるという結論になっています。

ここで利用された理論は以下の通りです。

理論

回帰式の決定

2 変数の関係を、yaxbの直線で表わすとすると、

x

を説明変数、yを目的変 数と呼ぶ。データ点からこの直線へ垂直におろした線の長さの2乗が最小となるよ うに係数a,bを決める。

平均

x, y

,標準偏差 ux,uy,相関係数 r とすると

u

y

r

a

u x

r

y

b  

y

(7)

回帰式の検討

重相関係数

R

目的変数の実測値と回帰式による予測値の相関係数

(説明変数が1つの場合 Rr

寄与率(重決定係数)

R

2 目的変数の変動のうち回帰式が説明する割合 回帰式の有効性の検定(残差が正規分布する場合のみ利用可能)

予測式を Yaxb であり、残差は  ~N(0,2)分布とする。

回帰係数の有効性の検定は、データ数 n,残差変動

n

i

i

i Y

y EV

1

)2

( ,説明変数 の不偏分散 ux2 として以下の関係を用いる。

2分布

2

~ ) 1 2 (

 

n

x

a t

u n n

EV

t a 2分布

2 2

~ ) 1 ( 1 2



 

 

n

x

b t

u n

x n n

EV t b

問題1

以下の2変数のデータを用いて問いに答えよ。

変数1 65 86 78 83 85 89 83 80 85 93 75 85 79 80 変数2 162 210 224 179 217 230 223 204 224 197 186 189 172 185

1)2変数の正規性が判定困難として、Pearson の相関係数とSpearman の順位相関係 数を両方を求めよ。

相関係数 順位相関係数

2)それぞれ相関係数が0と異なるかどうか有意水準5%で判定する。

確率 判定

相関係数 相関があると[いえる・いえない]

順位相関係数 相関があると[いえる・いえない]

3)変数2を目的変数、変数1を説明変数として回帰分析を行う。

回帰式 変数2=[ ]×変数1+[ ] 重相関係数 [ ]

寄与率 [ ]

4)回帰分析の有効性の検定は[行える・行えない]。

検定確率[ ]

回帰式は有効であると[いえる・いえない]

(8)

問題2

Samples¥テキスト9.txtのデータを用いて以下の問題に答えよ。

1)年収と支出についての相関係数と順位相関係数を求める。

相関係数[ ] 順位相関係数[ ]

2)年収と支出に相関があるといえるか、相関係数を選んで有意水準5%で判定する。

[相関係数・順位相関係数]で見る。

判定 確率[ ] 相関があると[いえる・いえない]

3)年収(横軸)と支出(縦軸)について以下のような散布図を描く。

4)支出を目的変数、年収を説明変数として回帰分析を行う。

回帰式 支出=[ ]×年収+[ ] 重相関係数 [ ]

寄与率 [ ]

5)回帰分析の有効性の検定は[行える・行えない]。

検定確率[ ]

回帰式は有効であると[いえる・いえない]

Referensi

Dokumen terkait

第 1 章 中国の内政と日中関係 高原 明生 はじめに 米中関係が対立の局面に突入した一方で、日中関係は上げ潮に乗っている。2018年10月、 安倍晋三総理は日本国総理として7年ぶりに中国を公式訪問した。五星紅旗とともに天安 門広場にはためいた日の丸の列が、日中関係の改善を象徴していた。安倍総理の中国滞在

たとえば,2個のさいころの目の数の和が2にな る場合と3になる場合では,起こりやすさが異なる。 じゅんさんの考えでは,それらの起こりやすさが同 じ,つまり,同様に確からしいとみなしているとこ ろに誤りがある。 なお,2個のさいころの目の数の和が偶数になる 確率は,次のように求めることができる。 2個のさいころをそれぞれ A,B と区別し,起こ

しかしながら、 「単調増加数列に上限が存在する」 ということの証明は、実は 実数とは何か? に立ち戻らなければならない 本授業ではそこまでは立ち戻らず、 これを実数の基本性質として認めることとする 詳しく学びたい人は、秋学期の 「現代数学B」(全学共通科目) を受講されたい... 収束・発散の判定法 さて、具体的な数列について、

3.4 三角関数入力 1 以下の微分方程式を解け。ただし、実数定数ω,β はω >0, β̸=ω を満たすとする。 d2x dt2 +ω2x= cosβt 10 [Step 1] まず、10式右辺=0とした斉次微分方程式の一般解を求める。x=eλt λは定数の形の解を仮定して得ら れる特性方程式 λ2+ω2= 0 を解くと2つの2虚数解 λ=±i ω

16:30〜17:30 講師 : 小俣 正朗 氏 (金沢大学) 題目 : 水面に浮かぶ泡のダイナミクス 要旨 : 水面上に浮かぶ泡のダイナミクスを数学、数値計算双方で探る。水面の泡をス カラー関数のグラフで表し、そのダイナミクスを記述する方程式をたてる。泡 の(上下)振動は波動方程式で記述する。ただし泡が水面下に潜らないことか

yr−1 yr     と表せる。このような未知関数の 1 次斉次式を連立したものを線形常微分方程式系とい い、多変数化を線形偏微分方程式系という。 さて、微分方程式を解く場合どのような範囲の関数の中で解を探すかということが問 題になる。例えば、Cs 級関数の範囲、実解析関数、超関数と呼ばれるものまで拡大して

13-1 6.意思決定を支援する分析 【動画 a】 6.1 ISM(Interpretive Structure Modeling) ISMは要素と要素の間の直接的な関係から、要素間の階層や構造を見つけ、それを図示す る手法です。演説や文章の中からキーワードを抜き出し、キーワード間の関係から文章の構 造をモデル化して調べるようなことにも使われます。ISM

図4 数量化Ⅰ類分析結果 数量化Ⅰ類では、カテゴリウェイトの値がカテゴリ間の制約条件(合計が 1 になる)から 一意的に定まらず、ここでは値が 3 種類の形式で与えられている。最も結果の解釈が容易 なカテゴリウェイトは基準化カテゴリウェイトである。この0/1形式のデータを用いて重回 帰分析を行った結果と一致するのが、重回帰カテゴリウェイトである。但し、重回帰分析