• Tidak ada hasil yang ditemukan

§3 データ分析で注意すべき点 演習問題

N/A
N/A
Protected

Academic year: 2024

Membagikan "§3 データ分析で注意すべき点 演習問題"

Copied!
3
0
0

Teks penuh

(1)

熊本大学 数理科学総合教育センター

§3 データ分析で注意すべき点 演習問題

問題の難易度の目安【易】899 【基礎】889 【標準】888

1

(899)(はずれ値)

同じ実験を6 回繰り返して,次の測定データが得られたとする:

実験データ 2.3 2.5 1.8 3.0 2.4 0.6 (1) 平均と分散を求めよ.

(2) 0.6 だけが異常に低い値と思われる.このデータだけ取り除いた,残り5個のデータの平

均と分散を求めよ.

(3) データ0.6 の扱いについて考察せよ.

2

(889)(1次式によるデータの変換1 )

α, β, γ, δを定数とし,β 6= 0, δ6= 0とする.2次元データ(x1, y1), . . . ,(xN, yN)を uk := xk−α

β , vk := yk−γ δ

により,データ(u1, v1), . . . ,(uN, vN)に変換する.変換前後の共分散sxyとsuvに対して,等式 sxy =βδsuv

が成り立つことを示せ.また,β, δ >0ならば,変換前後の相関係数rxyとruvに関して,等式 rxy =ruv

が成り立つことを示せ.

3

(889)(1次式によるデータの変換2 )

ある駅の不動産屋で8件の賃貸物件 (1LDK) の駅からの徒歩時間 (分) と1ヶ月の賃貸料 (万) を調べたところ次の表のようになった:

徒歩時間 1 3 3 4 6 7 7 9 賃貸料 8 6 5 7 6 5 6 5

1

(2)

熊本大学 数理科学総合教育センター

徒歩時間を変数x,賃貸料を変数yとし,次の問いに答えよ.

(1) 散布図を描け.

(2) 相関係数rxy を求めよ.また,徒歩時間と賃貸料にはどの程度の相関があると言えるか.

(3) 回帰直線を求め,散布図に描け.

4

(889)(第3ファクターの影響を無視した場合の相関係数)

3つ組データ(x1, y1, z1), . . . ,(xN, yN, zN)を考える.以下(y1, z1), . . . ,(yN, zN)の関係を調べる 際に,第3ファクターxiの影響がなくなるようにするために,



 ˆ

yi := sxy

s2x xi+ ¯y−sxy s2x x¯ ˆ

zi := sxz

s2x xi+ ¯y− sxz s2x

とおいて,(y1−yˆ1, z1−zˆ1), . . . ,(yN −yˆN, zN −zˆN)の相関係数を調べよう.以下簡単のため y0i :=yi−yˆi, zi0 :=zi−zˆi, i= 1, . . . , N

とおく.

(1) y¯0 = 0,z¯0 = 0を確かめよ.また,共分散sy0z0 が sy0z0 =syz− sxysxz

s2x

で与えられることを示せ.

(2) s2y0, s2z0 について

s2y0 =s2y (

1− sxy

sxsy 2)

, s2z0 =s2z (

1− sxz

sxsz 2)

で与えられることを示せ.

(3) (1), (2)を用いて,第3ファクターxを除いた新しいデータ(y0, z0)に関する相関係数ry0z0\x :=

sy0z0 sy0sz0

ry0z0\x = ryz−rxyrxz p1−r2xyp

1−rxz2

で与えられることを示せ.ry0z0\xを偏相関係数という.ここに,ryzはデータ(y, z)に関す る相関係数であり,rxy,rxzについても同様である.

2

(3)

熊本大学 数理科学総合教育センター

5

(889)(偏相関係数)

ある会社の社員の体重と年収について,データを取ってみたところ,それらの間には相関関係 があった.3次元データ(x, y, z)を

(x, y, z) = (年齢, 体重, 年収)

とする.ここで,体重yと年収zの相関係数ryzはryz = 0.90で高い相関を持っていた.ところ がAさんはこの相関に疑問を感じたため,年収・体重の両方に影響を及ぼしている第3のファ クターとして年齢xがあるのではないかと思い,実際に調べてみたところ,

・年齢x 体重yの相関係数rxy = 0.75

・年齢x 年収zの相関係数rxz = 0.80

であった.このとき年齢xの影響を取り除いた年収y,体重zの偏相関係数を求めよ.

3

Referensi

Dokumen terkait

[r]

[r]

[r]

熊本大学 数理科学総合教育センター 行列の定義と働き 演習問題2 解答例 mとnを自然数とする.mn個の実数 aij i= 1,2,.. , ain をその行列の第i行といい,左からj 番目 の縦の実数の並びa1j,

x y平⾯において,原点を中⼼として,x軸を⾓θだけ回転した直線をlθ とする.直線 lθ に関する折り返し(平⾯上の点をlθ に関して線対称な位置に写す操作)をTθ とする. 平⾯上の点をベクトルと同⼀視することによりTθ をR2からR2への写像とみなすと,こ れはR2からR2への線形写像となる.線形写像Tθ

計算の理論 プログラム内蔵方式von Neumann型では、 プログラム・データを区別なく メモリ上に置いていたが、 プログラムとデータとは、やはり本質的に違う • プログラム: 一つの問題では固定 • データ: 可変な入力 ⇓ どんな有効なデータ入力が来ても、 所定の出力を返すことが要請される —電子計算機概論I 6—... 計算の理論

計算の理論 プログラム内蔵方式von Neumann型では、 プログラム・データを区別なく メモリ上に置いていたが、 プログラムとデータとは、やはり本質的に違う • プログラム: 一つの問題では固定 • データ: 可変な入力 ⇓ どんな有効なデータ入力が来ても、 所定の出力を返すことが要請される... 計算の理論 或る問題の「計算が可能」 m

§1 データリテラシー 1 演習問題 解答 問題の難易度の目安【易】899 【基礎】889 【標準】888 1 899定量的データと定性的データ 1 次の語群を,定量的データと定性的データに分類せよ: 5段階アンケート調査, 不快度指数, 新生児指数, 気温, 国籍, 距離, 職種, 価格, 視聴率, 摂取カロリー, 血液型, 好きな食べもの. 2