Sample Distributions
關於〝變異數〞的抽樣分配
抽樣分配
統計對象 型態 分配類型
母體分配 樣本分配
離散型 機率分配
均勻分配 二項分配 多項分配 負二項分配 超幾何分配 幾何分配 伯努利分配 波松分配 連續型
機率分配
連續均勻分配 常態分配 標準常態分配 指數分配 Gamma分配 卡方分配
抽樣分配 機率分配
樣本比例差( Ƹ𝑝 − 𝑝 ) 平均數~
Z分配 t分配
變異數~
單母體變異數 卡方分配 兩母體變異數比 F分配
我們除了對於母體「平均數」或「比例」感到興 趣外,在某些議題上,更關注的是母體「變異數」
或「標準差」的資訊,因為變異數是衡量分配的 集中程度。所以像是機器生產,可藉由變異數來 估計機器的穩定度;在教育上,可估計學生成績 的差異情形。(卡方分配)
實務上,也可能需要比較來自兩個母體變異數的
差異,例如兩個不同品牌機器穩定度的比較;或
是兩個國家學生對於數學成績的差異狀況;或是
比較兩地區經濟水準,年所得變異越大,代表貧
富越懸殊,社會問題會更嚴重。(F分配)
𝝌 𝟐 distribution
卡方分配
(chi-square distribution)
卡方分配抽樣形成示意圖
樣本1
x
𝝌𝟐
樣本2 樣本3 樣本n
μ σ
母體分配~N(μ, σ2)
𝜒12 𝜒22 𝜒32 𝜒n2
(𝜇1, 𝜎1) (𝜇2, 𝜎2) (𝜇3, 𝜎3) (𝜇n, 𝜎n)
函數定義(分配形式)~原型
有 n 個獨立之常態隨機變數 x1, x2, x3, ……, xn ,其平均數 分別為 μ1, μ2, μ3, ….., μn ,標準差為 σ1, σ2, σ3, ….., σn :
𝑧 = 𝑥 − 𝜇 𝜎
𝜒n2 =
i=1
n 𝑥𝑖 − 𝜇𝑖 𝜎𝑖
2
𝜒
2= ( x − 𝜇 𝜎 )
2𝜒n2 =
i=1
n 𝑥𝑖 − 𝜇 𝜎
2
來在同一個 常態母體
χ2 變數也是隨機變數,與樣本大小有關,上述式子,
稱為具有「自由度 n 」的卡方分配。
函數定義(分配形式)~實務
實務上,母體平均數 μ 通常未知,故以 ҧ𝑥 來取代母體平均 數,此時「自由度」會少1,所以卡方分配可改寫為:
𝜒n−12 =
i=1
n 𝑥𝑖 − തx 𝜎
2
上述式子稱為具有「自由度 n-1 」的卡方分配。
又可得樣本變異數 𝑆2 = σ(𝑥𝑖 − ҧ𝑥)2
𝑛 − 1 ,帶入上式可得
𝜒𝑛−12 = (𝑛 − 1)𝑠2 𝜎2
卡方分配圖的性質
圖片來源:http://2012books.lardbucket.org/books/beginning-statistics/s15-chi-square-tests-and-f-tests.html
隨著自由度的增加,變異數會逐漸增大,且會逐 漸趨近於常態分配
期望值等於「自由度」: E(χ2)= n-1
變異數等於2倍「自由度」: V(χ2)= 2( n-1) 卡方分配為右偏分配
卡方分配的用途
進行單一常態分配母體的變異數統計推論。
可用來做適合度檢定(goodness-of-fit test)。
可用來做獨立性檢定(test of independence)。
可用來做變異數齊一性檢定
(test of homogeneity)。
卡方分配的查表
1
2
𝜒
α, n−12機率值 自由度
α
①先找自由度
②再找符合區域的 機率值α
𝜒
0.1, 52=
9.2364案例
「現代統計學」p129,吳柏林 著,五南圖書
機械公司新出產機車專用引擎,品管部門以引擎 轅軸長的變異數來判定生產過程是否有一致性。
假定每個引擎轅軸長的變異數為 0.8 ,整批產品 變異數超過 1.3 表示此批產品不佳?需要重新調 整生產過程。現在從產品中隨機挑選 10 個引擎,
試求重新調整生產過程之機率?
案例解說
用變異數判定一致性 → 考慮卡方分配;
每個引擎轅軸長變異數 0.8 → σ2=0.8 ; 超過 1.3 表示產品不佳 → 臨界值
抽取 10 個引擎 → n=10
P( s
2> 1.3 ) = p
n−1 s2𝜎2
>
10−1 1.30.8
= P( χ
2> 14.6) [卡方分配查表]
= 0.1
重新調整生產過程之機率為 0.1 。
𝜒𝑛−12 = (𝑛 − 1)𝑠2 𝜎2
F distribution
F分配
F分配抽樣形成示意圖
x
1μ
1σ
1母體分配~N(μ, σ2)
𝜒12
𝐹
x
2μ
2σ
2𝜒22
𝐹 =
𝜒12൘
𝑛1 − 1 𝜒22൘
𝑛2 − 1
自由度 (n1-1) 自由度 (n2-1)
函數定義(分配形式)~原型
F分配亦稱為Fisher分配,是由兩個卡方統計量的比值所形 成的抽樣分配,可用來估計兩個母體變異數比的問題。
假設有 2 個不同的常態母體x1, x2 ,隨機抽取樣本,樣本 數個別為 n1, n2 ,則F分配為:
上述式子,稱為具有「分子自由度 n1-1、分母自由度n2-1 」 的 F 分配。
𝐹( n1−1 , n2−1 ) =
𝜒12൘
𝑛1 − 1 𝜒22൘
𝑛2 − 1
x1自由度 x2自由度
函數定義(分配形式)~實務
從卡方分配可知,實務上會以樣本變異數 s2 來應用:
從式中可知,F分配可以推論兩個母體變異數的估計。
𝜒1,(𝑛2 1−1) = (𝑛1 − 1)𝑠12
𝜎12 𝜒2,(n2 2−1) = (𝑛2 − 1)𝑠22 𝜎22
⟹ 𝐹α( n1−1 , n2−1 ) =
s12൘
𝜎12 s22൘
𝜎22
df1 df2
γ1 γ2
F分配圖的性質
F分配的性質
期望值: E(x)= 𝜈1
𝜈2−1
變異數: V(x)= 2𝜈22(𝜈1+𝜈2−2)
𝜈1(𝜈2−2)2 𝜈2−4 , 𝜈2 > 4
假設隨機變數 X 為具有自由度 γ1 (=n1-1) 與 γ2 (=n2-1) 的 F分配,則:
重要查表性質: 𝐹𝛼 𝜈1, 𝜈2 = 1
𝐹1−𝛼 𝜈2, 𝜈1
F分配為右偏分配
F分配的用途
變異數分析。
迴歸分析中的整體檢定。
檢定兩個常態母體變異數是否相等。
代替二項分配做母體比例的推論。
F分配的查表
Fα(n1-1 , n2-1)
機率值 自由度 自由度
①先找2個自由度
②再找符合區域的機率值α
F0.05(8 , 6)=4.15 1
3 2
案例
「現代統計學」p130,吳柏林 著,五南圖書
投資風險的大小, 一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。
現在假設有A、B兩種投資組合,兩種投資組合的投資報 酬率均為20%。但是A投資組合十年來的獲利變異數為 8.4;B投資組合八年來的獲利變異數為3.1。如果兩種投 資組合的母體平均報酬率變異數均等,即 σ1/σ2 = 1,
試問
𝑠
12𝑆
22 大於2.7的機率是多少?案例解說
2個用變異數判定一致性 → 考慮 F 分配;
σ1/σ2 = 1 → 計算上不變
A:十年來… → n1=10 ; B:八年來… → n2=8
P(
s12s22
> 2.7 ) = p
s12൘
𝜎12 s22൘
𝜎22
>2.7
= P( F
α( (10-1), (8-1) ) > 2.7 ) [F分配查表]
= 0.1 ( = α )
機率為 0.1 。