Sample Distributions
關於〝平均數〞與〝比例〞的抽樣分配
抽樣分配
統計對象 型態 分配類型
母體分配 樣本分配
離散型 機率分配
均勻分配 二項分配 多項分配 負二項分配 超幾何分配 幾何分配 伯努利分配 波松分配 連續型
機率分配
連續均勻分配 常態分配 標準常態分配 指數分配
Gamma分配
卡方分配抽樣分配 機率分配
樣本比例差(
Ƹ𝑝 − 𝑝
) 平均數~Z分配 t分配
變異數~
單母體變異數 卡方分配 兩母體變異數比
F分配
Sampling Distribution of the Proportion
樣本比率的 Ƹ𝑝 抽樣分配
函數定義(分配形式)
母體比率與樣本比率
在抽樣調查實務中,經常對比率的問題感到興趣,例如偶 像劇的收視率、政黨支持的比率、學生打工比率、產品生 產瑕疵品比率等問題。若是母體的比率未知,就必須透過 抽樣方式來估計,假定:
𝑝 = 𝐾 𝑁
,其中N:母體個數;
K:母體中某類別的總個數
Ƹ𝑝 = 𝑘 𝑛
,其中n:樣本個數;
k:樣本中抽出某類別的個數
抽樣誤差
抽樣誤差=▏母體參數 – 樣本統計量 ▏=
▏𝑝 − Ƹ𝑝
▏函數定義(分配形式)
樣本比率的抽樣分配 ~ 採取出放回或無限母體
𝑓 Ƹ𝑝 = 𝐶
𝑛 ොn𝑝p
𝑛 ො𝑝q
n−𝑛 ො𝑝, Ƹ𝑝 =0,
1𝑛
,
2𝑛
.., 1 Ƹ𝑝 =
𝑥𝑛
⇒ 𝑥 = 𝑛 Ƹ𝑝 ,
帶入二項分配的機率函數,可得:期望值 變異數
E Ƹ𝑝 = 𝑝
V Ƹ𝑝 =
𝑝(1−𝑝)𝑛
E Ƹ𝑝 = E 𝑥
𝑛 = 1
𝑛 𝐸 𝑥 = 1
𝑛 𝑛𝑝 = 𝑝 V Ƹ𝑝 = 𝑉 𝑥
𝑛 = 1
𝑛2𝑉 𝑥 = 1
n2 (npq)
= 𝑝𝑞
𝑛 = 𝑝(1−𝑝)
𝑛
函數定義(分配形式)
樣本比率的抽樣分配 ~ 採取出不放回且有限母體
𝑓 ො 𝑝 = 𝐶
𝑛ෝ𝑝S
C
n−𝑛ෝN−S𝑝C
nN, ො 𝑝 =0,
1𝑛
,
2𝑛
.., 1 Ƹ𝑝 =
𝑥𝑛
⇒ 𝑥 = 𝑛 Ƹ𝑝 ,
帶入超幾何分配的機率函數:期望值 變異數
E Ƹ𝑝 = 𝑝
V Ƹ𝑝 =
𝑝(1−𝑝)𝑛
×
𝑁−𝑛𝑁−1
有限母體修正因子
(超幾何分配)
大樣本時的樣本比率抽樣分配
如果取出的樣本數很大時,np ≧ 5 且
n(1-p) ≧ 5,
根據中央極限定理:
ො
𝑝 ~ N( p, 𝑝(1−𝑝)
𝑛 )
採取出放回或無限母體
採取出不放回且有限母體
ො
𝑝 ~ N( p, 𝑝(1−𝑝)
𝑛 × 𝑁−𝑛
𝑁−1 )
⟹ 𝑍 = 𝑝−𝑝 ො
𝑝(1−𝑝) 𝑛
~ N(0,1)
案例
假設台北市國小學生有10%的比例有體重過重的 現象,現在隨機抽取400位台北市國小學生,其 體重過重的比例之期望值及變異數為多少?又體 重過重之比率大於12%之機率為多少?
「現代統計學」p123,吳柏林 著,五南圖書
案例解說
10%比例 → p=0.1 ;抽取400人 → n=400 ;→ 符合二項分配
(1) E( Ƹ𝑝) = p = 0.1 , V Ƹ𝑝 =
𝑝(1−𝑝)𝑛
=
0.1×0.9400
= 0.000225 (2)P( Ƹ𝑝> 0.12)= p
p−0.1ෝ0.000225
>
0.12−0.10.000225
= P(Z > 1.33) [查表]
= 1-0.9082 = 0.0918
Sampling Distribution of the Mean
樣本平均數 𝑥 ҧ 的抽樣分配
函數定義(分配形式)
利用樣本平均數
ҧ𝑥
來推論出母體的平均數μ,來瞭解母體 集中趨勢。假定現在從母體中隨機抽取n
個樣本,根據「中央極限定理」,當
n
很大時,樣本平均數ҧ𝑥
n 將趨近 於平均數 μ ,變異數 σ2/n
的常態分配:Z 𝑥 ҧ
𝑛
= 𝑥 ҧ
𝑛− 𝜇 𝜎 2
𝑛
⟶ 𝑁( 0,1 )
轉化為標準常態分配後,就可以利用查表方式將結果查出。
樣本變異數 S 2
我們利用樣本平均數
ҧ𝑥
來推論出母體的平均數μ,同樣地,根據變異數σ2的原始定義,我們可以使用樣本變異數
S
2 來推論母體的變異數:𝑆
2= σ(𝑥
𝑖− ҧ 𝑥)
2𝑛 − 1
S
2 也稱為σ2的「不偏估計量」,因為:E(S
2) =E(
σ(𝑥𝑖 − ҧ𝑥)2𝑛−1
) = σ
2「n-1」 稱為〝自由度〞
(degree of freedom, df)
Student's t distribution
t 分配
函數定義(分配形式)
t分配由英格蘭化學家W.S.Gosset在1908年所提出,他將 Z分配與卡方分配結合創造了t分配。其適用在當我們實務
上不知道母體變異數的狀況下,可以利用t分配來取代Z分 配。也就是說,只要母體為常態分配且母體變異數未知,就可以用t分配來估計母體平均數。
𝑡 = 𝑥 ҧ
𝑛− 𝜇 S 2
𝑛
⟶ 𝑡( n − 1 )
可藉由查表而得
t分配特性
期望值 變異數
E(x) = 0 , ν > 1 V x =
νν−2
, ν > 2
若隨機變數X為具自由度 ν 之t分配
偏態係數 β
1= 0
峰度係數 β
2=
3(ν−2)ν−4
, ν > 4
n → ∞時,t 分配趨近N(0,1)
t分配使用時機
樣本抽自母體,n < 30,母體變異數未知時,可 用t 分配估計母體平均數。
兩個常態母體變異數未知,且樣本皆為小樣本情 況下,兩母體平均差 μ
1-μ
2的推論。
可用於變異數分析的事後檢定,以及相關分析、
迴歸係數之推論。
案例
假設X代表某班級統計學成績,已知其為 常態分配,X~N( 80, σ2 ),現自該班級 抽出10位學生,算出其標準差等於8.63,
求此10位學生之平均成績在85分以上的 機率是多少?
「應用統計學 二版」p215,李德治、童惠玲 著,博碩文化
案例解說
X~N( 80, σ2 ) → 常態分配,小樣本(10)且變異數「未知」 → 考慮 t分配 根據題目所提供資訊: μ = 80, S2=8.63 ,自由度=9
P( 𝑥 ҧ > 85)= p t
9>
85−808.632 10