二、统计假设实验
1、统计假设检验的步骤
先假设总体具有某种统计特性(如具有某种参数,或遵从某种分布等),然后再检验这个 假设是否可信,这种方法称为统计假设检验(或假设检验),其步骤如下:
例 已知某产品平均强度0 9.73公斤,现改变制作方法,并随意抽取200件,算得 94
.
9
x 公斤,s1.62公斤。问制作方法的改变对强度有无显著影响?
统计假设检验步骤 过 程 分 析
(1) 假设H0
(2) 选取统计量,明确其分布
(3) 给出显著性水平
(4) 查出置信限
2
K
(5) 计算统计量u
(6) 统计推断 当
2
K
u 时,接受H0
当
2
K
u 时,否定H0
H0: 0
(是制作方法改变后的总体均值)
) 1 , 0 ( ) ~
( 0
s N x
u n
%
5
由
2
2
2
1 d 2
1 2
K K
v
v e
查正态分布表得K0.025=1.96
84 . 1 83 . 62 1
. 1
) 73 . 9 94 . 9 (
200
u 由于
u 1.841.96K0.025
所以相信 H0 ,以 5%的显著性水平认为制
作方法的改变对产品强度无显著影响。
2. 正态总体参数的统计假设检验表
对于大样本,不管总体遵从什末分布,根据中心极限定理,可以认为样本均值x 渐近遵从 正态分布。因此,利用下述“ u检验法”对总体参数进行统计假设检验。
表中为给定的显著性水平,x 为样本均值,s为样本标准差。
名 称
条件与检验目的 假 设 H0
统计量及其分布 否定域 置信限的确定
u 检 验 法
已知总体方差2, 检验总体的均值 是否等于(或小于 或大于)已知常数
0
0
0
0
) 1 , 0 (
~
)
( 0
N x u n
2
K
u
K
u
K
u
2
2
2
1 d 2
1 2
K K
v
v e
K v
v
e d 1
2 1 22
K
v
v
e d 1
2 1 22
已知两总体方差相 等
2 2 2 2
1
比 较 两 总 体 均 值
1和2
2
1
2
1
2
1
) 1 , 0 (
~
1 1
2 1
2 1
N
n n
x u x
2
K
u
K
u
K
u
2
2
2
1 d 2
1 2
K K
v
v e
K v
v
e d 1
2 1 22
K
v
v
e d 1
2 1 22
条件与检验目 假 设
统计量及其分布
否定域 置信限的确定 已知两总体方差
12,22 比较两总体均值
1和2
2
1
2
1
2
1
) 1 , 0 (
~
2 2 2 1 2 1
2 1
N
n n
x u x
2
K
u
K
u
K
u
2
2
2
1 d 2
1 2
K K
v
v e
K v
v
e d 1
2 1 22
K
v
v
e d 1
2 1 22
t 检
验 法
总体方差未知,检 验总体均值是否等 于(或小于或大于)
已知常数0
0
0
0
) 1 (
~
)
( 0
n t
s x
t n
t
t
t2
t
t2
t
t
t t(n 1)dv 1
tt(n1)dv1
tt(n1)dv1已知两总体的方差 相同(但值未知),
比较两总体的均值
1和2。
2
1
2
1
2
1
2 ) 1 ( ) 1 (
) 2 (
~
1 1
2 1
2 2 2 2 1 1 0
2 1
2 1 0
2 1
n n
s n s s n
n n t
n s n
x
t x t t
t2
t
t2
t
t
t t(n1 n2 2)dv 1
t2t(n1n2 2)dv1
2
1 d ) 2 ( 1 2
t t n n v
2
检 验
法
已知总体均值0, 检验总体方差2 是否等于(或小于 或大于)已知常数
2
0 。
2 0
2
2 0
2
2 0
2
) (
~
) 1 (
2 1
2 2 0
2
n
x
n
i i
2 22 或
2 21
2
2 2
2 1
2
2 2
d 2 )
2(
n v
或
2
12 2( )d 1 2
n v
22(n)dva
22(n)dv1 总体均值未知,检验总体方差2 是 否等于(或小于或 大 于 ) 已 知 常 数
2
0 。
2 0
2
2 0
2
2 0
2
) 1 (
~
) 1 (
2 1
2 2
0 2
n
x x
n
i i
2
2
2
或
2 1 2
2
2 2
2 1
2
2 2
d 2 ) 1
2(
n v
或
2
2
1 2( 1)d 1 2
n v
22(n1)dv
22(n1)dv1F 检 验 法
两总体的均值和方 差未知,比较两总 体方差
2
1
2
1
2
1
) 1 , 1 (
~
) 1 , 1 (
~
1 1 (
~
, min
, max
1 2 2
2 2 1
2 2 1
2 2 1
2 2 2 1
2 2 2 1
n n s F F s
n n s F F s
n n F
s s s s
s F s
)
, 小
大
小 记 大
2
F
F
F
F
F
F
0F2 ( 1 1 d 12 v nn
F 大 , 小 )
0FF(n11,n2 1)dv1
0FF(n2 1,n1 1)dv13、总体分布函数的统计假设检验
设 F0(x)F0(x,1,2,,k)为已知类型的分布函数,1,2,,k为参数(已知或部分已 知),x1,x2,,xn为总体的样本,假设的分布函数为F(x),分两种情况进行统计假设检验。
1° F0(x)的全部参数已知 把实轴(,)分成m个不相交的区间:
, ,
), , , 2 , 1 ](
,
(ci ci1 i m c1 cm1 其中(cm,cm1]理解成(cm,)。记理论频率为 τi F0(ci1)F0(ci)P(ci ci1)
的样本{x1,x2,,xn}落在区间(ci,ci1]的个数为vi(经验频率),那末统计量
m
i i
i i
nr nr v
1
2
2 ( )
遵从自由度为m1的分布,应用2检验法便可检验假设 H0: F(x)=F0(x)
是否可信。
2° F0(x) 的参数全部或一部分未知 设F0(x)有l个参数 , , , ( )
2
1 l k
jl
j
j
未知,可先
用最大似然法(本节,一,3)定出这l个参数的估值,把这些估值就当作F0(x)的相应参数,
于是类似 1°的情形可计算理论频率,再算出经验频数,那末统计量
m
i i
i i
nr nr v
1
2
2 ( )
当n很大时遵从自由度为ml1的分布。应用2检验法便可检验假设 H0: F(x)=F0(x)
是否可信。
4、两个样本是否来自同分布总体的统计假设检验
[符号检验法] 此法简单、直观,不要求对检验量的分布规律有所了解,常用来检验波动 的程度是否一样和检验生产的状况有无明显的改变等问题。
用符号“ +” ,“ -” 与“ 0” 分别表示甲比乙的数据大、小与相等,并用n,n与n0表示出 现“ +” ,“ -” 与“ 0” 的次数。统计假设检验步骤用例说明如下:
例 甲乙两人分析同一物质中某成分的含量,得下表
甲 乙 符号
14.7 15.0 15.2 14.8 15.5 14.6 14.9 14.8 15.1 15.0 14.6 15.1 15.4 14.7 15.2 14.7 14.8 14.6 15.2 15.0 + - - + + - + + - 0 甲
乙 符号
14.7 14.8 14.7 15.0 14.9 14.9 15.2 14.7 15.4 15.3 14.6 14.6 14.8 15.3 14.7 14.6 14.8 14.9 15.2 15.0 + + - - + + + - + +
问两人的分析结果有无显著差异?
统计假设检验步骤 过 程 分 析 (1) 假设H0
(2) 统计量
(3) 给出显著性水平 (4) 查出置信限
(5) 计算统计量 (6) 统计推断
当r ra时,接受H0 当r ra时,否定H0
假设两人分析结果具有相同的分布函数 r= min {n+ , n-}
a=10%
查符号检验表(见下页),由 N=n++n =12+7=19,
a=10% 得ra 5 即否定域为rra 5. rmin{12,7}7
因为 r=7>5=r10%
所以接受 H0,即以 10%的信度认为甲乙两人的
分析结果无显著差异.
符 号 检 验 表
N
1 5 10 25
() N
1 5 10 25
() N
1 5 10 25 ()
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0 0 0 0 0 0 1 0 0 1 0 0 1 1 0 1 1 2 0 1 1 2 0 1 2 3 1 2 2 3 1 2 3 3 1 2 3 4 2 3 3 4 2 3 4 5 2 4 4 5 3 4 5 6 3 4 5 6 3 5 5 6 4 5 6 7 4 5 6 7 4 6 7 8 5 6 7 8 5 7 7 9 6 7 8 9 6 7 8 10 6 8 9 10 7 8 9 10 7 9 10 11
31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
7 9 10 11 8 9 10 12 8 10 11 12 9 10 11 13 9 11 12 13 9 11 12 14 10 12 13 14 10 12 13 14 11 12 13 15 11 13 14 15 11 13 14 16 12 14 15 16 12 14 15 17 13 15 16 17 13 15 16 18 13 15 16 18 14 16 17 19 14 16 17 19 15 17 18 19 15 17 18 20 15 18 19 20 16 18 19 21 16 18 20 21 17 19 20 22 17 19 20 22 17 20 21 23 18 20 21 23 18 21 22 24 19 21 22 24 19 21 23 25
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
20 22 23 25 20 22 24 25 20 23 24 26 21 23 24 26 21 24 25 27 22 24 25 27 22 25 26 28 22 25 26 28 23 25 27 29 23 26 27 29 24 26 28 30 24 27 28 30 25 27 28 31 25 28 29 31 25 28 29 32 26 28 30 32 26 29 30 32 27 29 31 33 27 30 31 33 28 30 32 34 28 31 32 34 28 31 33 35 29 32 33 35 29 32 33 36 30 32 34 36 30 33 34 37 31 33 35 37 31 34 35 38 31 34 36 38 32 35 36 39 [注] 表中数字表示对应于符号和N与显著性水平的符号限r 。
[秩和检验法] 此法比符号检验法的精度要高,能更好的利用数据提供的信息,并且不要求数据
“ 成对” .其步骤用例说明如下:
例 对用甲乙两种材料制成的产品进行寿命试验,得
甲 1610 1650 1680 1700 1750 1720 1800 乙 1580 1600 1640 1640 1700
问两种材料对产品质量的影响有无显著差异?
解 把上述数据从小到大排成下表:
秩 1 2 3 4 5 6 7 8 9 10 11 12 甲 1610 1650 1680 1700 1720 1750 1800
1580 1600 1640 1640 1700
乙
上表中第一行秩表示从小到大排列的序数,数据1700甲乙均有,排在8,9两个序位,其秩按 平均秩取为 8.5
2 9
8 。
统计假设检验步骤 过 程 分 析
(1) 假设H0
(2) 统计量
(3) 给出显著性水平
(4) 查出置信限
(5) 计算统计量
(6) 统计推断
当T T T时,接受H0 当T T或T T时,否定H0
假设两种材料对产品寿命影响无显著差异 T=样品数目小的那组的秩和
%
5
查 “ 秩 和 检 验 表 ” ( 见 下 页 ), 参 数 n1=5,n2=7
(n1n2 ,为两样本的大小)对5%,得T
的下限T 22
和上限T43(即否定域T T 22或
43
T
T )
T=1+2+4+5+8.5=20.5(乙组的秩和)
因为T 20.522T5% ,所以否定H0,即 以 5%的认为两种材料对产品寿命的影 响有显著差异
秩 和 检 验 表
n1 n2 T T n1 n2 T T n1 n2 T T n1 n2 T T n1 n2 T T
2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3
4 5 6 6 7 7 8 8 9 9 10 10 3 4 4 5 5
3 3 3 4 3 4 3 4 3 4 4 5 6 6 7 6 7
11 13 15 14 17 16 19 18 21 20 22 21 15 18 17 21 20
3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4
6 6 7 7 8 8 9 9 10 10 4 4 5 5 6 6 7
7 8 8 9 8 9 9 10 9 11 11 12 12 13 12 14 13
23 22 25 24 28 27 30 29 33 31 25 24 28 27 32 30 35
4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5
7 8 8 9 9 10 10 5 5 6 6 7 7 8 8 9 9
15 14 16 15 17 16 18 18 19 19 20 20 22 21 23 22 25
33 38 36 41 39 44 42 37 36 41 40 45 43 49 47 53 50
5 5 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7
10 10 6 6 7 7 8 8 9 9 10 10 7 7 8 8 9
24 26 26 28 28 30 29 32 31 33 33 35 37 39 39 41 41
56 54 52 50 56 54 61 58 65 63 69 67 68 66 73 71 78
7 7 7 8 8 8 8 8 8 9 9 9 9 10 10
9 10 10 8 8 9 9 10 10 9 9 10 10 10 10
43 43 46 49 52 51 54 54 57 63 66 66 69 79 83
76 83 80 87 84 93 90 98 95 108 105 114 111 131 127
[注] 表头n1,n2(n1 n2)表示两组数据的个数;T和T分别为秩和的下限和上限。2.5% 对应的秩和上、下限用黑体数字表示, 5%对应的秩和上、下限用普通字体表示。
三、方差分析
方差分析是分析试验(或观测)数据的一种方法,它所要解决的基本问题是通过数据的 分析,弄清与研究对象有关的各个因素以及各个因素之间的交互作用对该对象的影响。它所 研究的对象都假定遵从正态分布。
[单因素方差分析] 考虑一个因素A的不同水平对所考察的对象的影响。对A的k个不同 水平A(其分布i ~ N(i,i2),(i1,2,,k)进行试验,得试验数据{xij}(i 1,2,; j1,2,, nk) 假定1 2 k(尽管数值未知),检验各Ai的试验结果的平均值有无显著差异。其检 验步骤如下:
(1) 假设H0 :1 2 k (2) 选取统计量并明确其分布
) , 1 (
~
) 1 (
) 1 (
1
1 1
2 1
2
2 1
k n k F
x k x
n
x x k n
s
F s k
i n
j
i ij k
i i i
i
式中
k
i i n
j ij i
i x i k n n
x n
i
1 1
, ) , , 2 , 1 ( 1 ,
k
i i i k
i n
j
ij nx
x n x n
i
1
1 1
1 1
(3) 给出显著性水平
(4) 由F分布表(自由度为(k-1,n-k))可以查出置信限Fa,它满足
FF(k1,nk)dv(5) 列表计算统计量。
分
级 试验数据xij ni
ni
j
xij 1
2
1
ni
j
xij
2
1
1
ni
j ij i
n x
ni
j
x ij 1
2
A1
A2
Ak
x11 x ... 12
1n1
x x21 x22 ...
2n2
x
...
1
xk xk2 ...
knk
x
n1
n2
nk
1
1 1 n
j
x j
2
1 2 n
j
x j
nkj
xkj 1
2
1 1
1
n
j
x j 2
1 2
2
n
j
x j
2
1
nk
j
xkj
2
1 1 1
1 1
n
j
x j
n
2
1 2 2
1 2
n
j
x j
n
2
1
1
nk
j kj k
n x
1
1 21 n
j
x j
2
1 22 n
j
x j
nkj
x kj 1
2
ki
k
i
ni
n
1
k
i n
j ij
i
x
1 1
2
1 1
1
k
i
n
j ij i
i
n x
k
i n
j ij
i
x
1 1
2
记号
2
1 1
1
k
i n
j ij
i
n x P
2
1 1
1
k
i
n
j ij i
i
n x
Q
k
i n
j ij
i
x R
1 1
2
(6) 单因素方差分析表
方差 来源
平方和 自由度 均 方 统计量 置信限 统计推断
组间
组内 S R Q P Q S
2
1 k1
nk
1
1
1
k s S
k n s S
2
2 2
1
s
F s F(n1,nk)
当 FF 时,接受H0 当F F时,
否定H0 总和 SRP n1
说明:1° 若xij的数值较大,取xij xij c,c为某常数,则用xij代替xij进行上述计算,其分 析结果不变。2° 组间方差S1反映了因素 A的不同水平引起的系统误差,而组内方差 S2则是 随机因素引起的组内差异。如果不同因素Ai所起的作用差不多,组间方差与组内方差之比就 较小,则可认为1 2 k;如果不同因素Ai所起的作用显著不同,组间方差与组内方 差之比就较大,就不能认为1 2 k。
[双因素方差分析] 考虑两个因素A和B的影响。A分成l个等级A1 , A2 , ··· ,Al。B分成
m个等级B1 , B2 , ···,Bm 在双因素Ai Bj 条件下(即每次试验都要让Ai与Bj作lm种配合)
作n次试验,得lmn个数据xij(k)(k1,2..n;i1,2..l;j1,2..m)。假定
xij(k) 的分布~N(ij,), 检验A的作用或B的作用或AB的作用分别对试验结果有无显著影响。其检验步骤如下:(1) 假设H0 :对应的作用(A或B或AB)对试验结果无显著影响。
(2) 选取统计量并明确其分布
)) 1 ( , 1 (
~ ) ) (
1 (
1
) 1 (
1 1 1
2 ) ( 1
2
n lm l F x
n x lm
x l x
mn s
F s l
i m
j n
k
ij k ij l
i i A
A 误
)) 1 ( , 1 (
~ ) ) (
1 (
1
) 1 (
1 1 1
2 ) ( 1
2
n lm m F x
n x lm
x m x
nl s
F s l
i m
j n
k
ij k ij m
j j B
B 误
)) 1 ( ), 1 )(
1 ((
~
) ) (
1 (
1
) ) (
1 )(
1 (
1 1 1
2 ) (
1 1
2
n lm m
l F
x n x
lm
x x x m x
l n s
F s l
i m
j n
k
ij k ij l
i m
j
j i ij B
A B A
误
式中FA , FB 及FAB分别表示因素A的作用,B的作用及因素A与B的交互作用,且
n
k k ij ij
ij x
x n x n
1 )
1 (
1 ,
m
j n
k k ij m
j ij
i x
x mn x m
1 1
) ( 1
1 1
l
i n
k k ij l
i ij
j x
x ln x l
1 1
) ( 1
1
1
l
i m
j n
k k
xij
x lmn
1 1 1
)
1 (
(3) 给出信度。
(4) 查出置信限F。当自由度为(f1, f2),则F满足
F0F(f1, f2)dv(5) 列表计算统计量(表 1 和表 2)。
表 1
A B 试验结果xij(k)
n
k k ij
ij x
x
1 ) (
2
1 ) 2 (
n
k k ij
ij x
x
n
k k
xij 1
2 ) ( ) (
A1
B1
B2
Bm
) 1 (
x11 x11(2)... x11(n)
) 1 (
x12 x12(2)... x12(n)
) 1 (
x1m x1m(2)... x1(mn)
x11 x12 x1m
x112 x122 x1m2
nk
xk 1
2 ) ( 11 ) (
nk
xk 1
2 ) ( 12 ) (
nk k
xm 1
2 ) (
1 )
(
Al B1 B2
Bm
) 1 (
1
xl xl(12)... xl(1n)
) 1 (
2
xl xl(22)... xl(2n)
) 1 (
xlm xlm(2)... xlm(n)
xl1
xl2 xlm
xl21 xl22 xlm2
nk k
xl 1
2 ) (
1 ) (
nk k
xl 1
2 ) (
2 ) (
nk k
xlm 1
2 ) ( ) (
li m
j
1 1
l
i m
j
xij
1 1
l
i m
j
xij
1 1
2
l
i m
j n
k k
xij
1 1 1
2 ) ( ) (
记号 2
1 1
1
l
i m
j
xij
P lmn
l
i m
j
xij
T n
1 1
1 2
l
i m
j n
k k
xij
W
1 1 1
)
( (
表 2
B
A B1 B2 ... Bm
mj 1
2
1
m
j