第七章
假
设
检
验
在前面的章节中阐明了第一类统计推断方法 —— 估计,在本章中将论述第二类统计推断方法,即假设检验。从中可看到假设检验和区间估计之间的某些相似点和相异点。在这两章中,让人感兴趣的都是同一些参数,不过在七章中将从下述的角度去分析样本数据,即看看这些数据是否支持对某些参数的大小所做的假设。而在上一章中,却并未涉及对参数的假设进行后分析,相反,倒是利用样本数据来帮助人们形成对参数值的看法。
假设检验的目的同估计一样,在于帮助研究人员通过考察对来自某总体的样本数据做出有关该总体的统计决策。
第一节
基
本
概
念
一、假设检验的意义
在统计研究工作中常常要对一些统计量进行分析比较。人们经常会遇到两个统计量的差异问题,如两个平均数的差异、两个率的差异等待。两个样本统计量之间的差异,可能由两种原因造成:一是由于抽样误差而造成,抽样误差而造成的差异是不可避免的,但样本仍来自同质的总体,所以这种差异没有本质的区别。二是由于实验因素或观察条件的改变而造成的差异,这种误差叫做条件误差,此时样本可能会来自不同质的总体,其差别是本质性的差别。人们当然希望能正确地区分出样本统计量之间的差异是由哪种原因造成的。假设检验就是帮助人们去区分差异是由抽样误差还是由条件误差造成的一种科学方法。
二、假设检验的基本原理
在实际工作中,无论假设多么复杂,进行检验的基本思想却很简单,就是某种带来有概率性质的反证法,即按“小概率事件在一次观察中实际上不可能发生的”的统计原则,拒绝在一次具体实践中竟然发生了小概率事件的不合理的假设。但是如果实践所导致的结果没有发现小概率事件的不合理现象,则不能拒绝原假设 H 0
,因而接受它。
什么算是“小概率事件”?通常人们把概率不超过 5% 的事件称为小概率事件,其概率记作 。在假设检验中,称
为显著性水平。如经过检验,在
= 0.05 水平拒绝无效假设 H 0 ,则称差异有显著性意义;如在
= 0.01 水平拒绝 H 0
,则称差异有非常显著性意义。
三、假设检验中的两类错误
在假设检验中,并不能证明一个统计假设是否正确。当检验结果已经得出,就有两种可能采取的行动;(1)否定 H 0
;(2)不否定 H 0
。一个未被否定的假设可能的真实的,也可能是不真实的。同样,一个被否定的假设也可能是真实的或不真实的。于是,在检验一个假设时将出现四种可能的结果:
(一)不否定真实的无效假设;
(二)不否定不真实的无效假设;
(三)否定真实的无效假设;
(四)否定不真实的无效假设。
以上,(一)和(四)的正确的行动,而(三)犯了“弃真”的错误,称这为第Ⅰ类错误;(二)犯了“取伪”的错误,称这为第Ⅱ类错误。
表 表 7 7
—
1 1
双向分类表
可能的行动
假设的可能状态
真
非
真
不 否 定
对
错(Ⅱ)
否
定
错(Ⅰ)
对
在统计分析时,是以显著性水平
检验假设,若当 H 0
为真时否定 H 0
,则犯第Ⅰ类错误的概率明显正是
。通常把犯第Ⅱ类错误的概率记作 。当然,人们总希望这两类错误的概率都尽可能的小。但不理想的是,在样本含量 n 不变时,减小
将引起
增大,减小
将引起
增大。同时减小犯两类错误的概率的唯一途径是增加样本含量,但要注意这样会增大工作量,会多耗费人力物力。所以在实际工作中,要全面考虑,选定适当的 n 、 、 。
必须强调指出,在研究工作中必须及早选定
。要是等到算出检验统计量的数值之后再选 ,则选择就可能受到计算结果的影响,从而会在相当程度上损害研究的客观性。
四、单侧检验与双侧检验
(一)双侧检验问题
双侧检验的目的在于检验两个参数是否相等,如总体均数 =0 还是 ≠ 0,这时,研究人员关心两均数之间的绝对差别,而不关心差别的方向。
/2 /20X 1 X 2X0 0: H
图 图 7 7
—
1 1
双侧检验示意图
如(图 7—1)所示:是把 X
的临界值 X 1 ,X 2 分配在0的两侧。由于要求(X 1 ,X 2 )间的概率是置信度 1- ,这相当于把
分配在 H 0
分布两侧的尾部,每一侧占
的二分之一。“双侧检验”这个名称就是这样来的。
(二)单侧检验问题
在许多情况下,研究人员根据理论分析或实践经验可预知某一均数不大于(或不小于)另一均数,这时可作无效假设 H 0
:1 ≤2 (或H 0
:1 ≥2 )。因此在拒绝接受 H 0
时,就只接受1 >2 (或1 <2 ,这时要把
全部放在分布的一侧。即所谓“单侧检验” ( 左侧 )( 右侧 ) 图
7 7
—
2 2
单侧检验示意图
单侧检验比双侧检验容易得出差别有显著意义的结论,所以对于同一批资料,有时双侧检验无显著意义,而单侧检验却有显著意义。但要采用单侧检验还是双侧检验必须在作研究设计时根据客观实际及专业知识事先选定。
五、假设检验的一般步骤
(一)建立无效假设 H H 0 0
;
(二)识别选择检验统计量;
(三)选定显著性水平
;
(四)收集数据、完成计算;
(五)按决策规则作出统计决策。
如果检验统计量的计量值落在否定域之内,则否定无效假设;如其值落在接受域之内,则接受无效假设;当检验统计量的计算值等于临界值或接近临界值时,则一般也否定无效的假设,但此时下结论要慎重,最好扩大样本含量重新再作检验。
0 得出
可能真实的结论H1得出
可能真实的结论 H作统计决策拒绝0H接受0H计算检验统计量选择检验统计量无效假设0H选定显著性水平 图
7 7
—
3 3
假设检验一般步骤框图
第二节
一个正态总体均数的假设检验
一、总体方差2 已知时,总体均数与某指定数之间差别的假设检验
已知被研究的总体服从正态分布 N( , 2 ),且参数2 已知,但 未知,现要对 进行统计检验。
从第六章中知道,当被抽样总体服从正态分布时, X 的抽样分布服从平均值为 、方差为n2斩正态分布。为了检验 是否等于已知
数 0 ,建立无效假设 H 0
:
=0 ,从而能从样本数据算出的检验统计量应为
nXU0
(7 — 1)
这个统计量服从标准正态分布。
对于选定的显著性水平 ,有 P{ |U|≥ 2u
} = 所以选择 |U|≥ 2u
为否定域;即当该不等式成立时,就否定 H 0
。
类似地,有
P{|U|< 2u == 1- 即 |U|< 2u
,为接受域。
换句话说,规定了 之后,也就取定了接受域和否定域的分界线。如取 =0.05 ,与标准正态分布曲线下两尾侧面积 2=0.025
相对应的 u 值分别为 -1.96 和 1.96 。
否定域由大于或等于 1.96 和小于或等于 -1.96 的所有 u 值构成。如(图 7 — 4)所示。
0 -1.96 1.96025 . 0 2 / 025 . 0 2 / 95 . 0 1 否定域 否定域 接受域 图 图 7 7 - 4
标准正态分布下 =0.05 时的接受域和否定域
例 7 — 1
根据医学统计,我国健康成年男子在安静时的平均心率为 72 次/分,标准差为 6.4 次/分。今对某体育系男生随机抽测36 人,其安静时平均心率为 69.5 次/分,试问该体育系男生的心率是否与国内一般健康成年男子不同?( =0.05)
解:(1)建立无效假设 H 0
:
=72(即假设该体育系男生心率与一般健康男子相同,其差别是由抽样误差造成的。)
(2)计算统计量 U 值:
364 . 6| 72 5 . 69 |n| x || U |0 ≈2.34 (3)取 =0.05,查表可知临界值 2u
(4)判断结果:因为|U|=2.34>2u =1.96,所以拒绝无效假设 H 0
,认为该体育系男生的心率和一般健康成年男子的心率有显著性差异。这种差异显然是因为体育系学生经常进行体育训练造成的。
在上面例子中,取 = 0.05。在有些实际问题中,还应当把显著性水平取得更小些。同一问题采用不同的显著性水平处理,常可能得到不同的结论。如在上例中,若取 = 0.01 ,则临界值2u =2.58,此时,|U|=2.34<2.58,应接受 H 0
。
二、总体方差 2 未知,且为大样本时,总体均数与某指定数之间差别的假设检验。
在很多情况下,感兴趣的总体可能并非正态分布,这时若把分析建立在正态分布的基础之上,就会得出错误的结论。因此,当被抽样
总体不服从正态分布时,就必须知道样本平均值的抽样分布的性质。当从非正态分布总体进行抽样时,关于 X
的抽样分布的知识将来自一条重要的数学定理,即“中心极限定理”。这条定理的内容陈述如下:
给出一个具有任意函数形式的总体,其平均值为 ,方差2 有限。如从这一总体抽出容量为 n n 的样本,则当样本容量很大时,由这些样本算出的
X
的抽样分布将近似服从平均值为 、方差为n2的正态分布。
在取大样本的情形下,中心极限定理既能从非正态分布总体抽样,又能保证得到与正态分布总体抽样时近似相同的结果。这结果对于统计推断方法的应用来说十分有用。
在实际问题中,常需要在总体方差未知的条件下对总体均数进行假设。对于这种情形,不好采用统计量 nXU0 因为 未知。这时,通常用 S 代替 ,这将会有误差,但对大样本来说,误差不大,由中心极限定理可知 X 分布近似正态分布。所以,此时检验统计量为 nSXU0 ~ N(0 , 1)
(7 — 2)
取定后 ,|U|≥ 2u 为 H 0
:
=0的否定域; |U|<2u
为 H 0
:
=0的接受域。
例 例 7 — 2
由全国青少儿体质调查资料知:全国城市 7 岁男生
身高平均数为 117.3 厘米,北京市 205 名 7 岁男生身高平均为 118.3厘米,标准差为 4.8 厘米,问北京市 7 岁男生的身高与全国 7 岁男生的身高之间有无显著性差异?
( =0.01)
解:(1)无效假设 H 0
:
=117.3 (2)计算统计量值:
|U|=nS| X |0 =2058 . 4| 3 . 117 3 . 118 | ≈2.98 (3)因为取 =0.01,则2u =2.58, (4)判断结果:|U|≈2.98>2.58,拒绝 H 0
,认为北京市 7岁男生的身高与全国城市 7 岁男生的身高之间有非常显著性差异。
三、总体方差2 未知,且为小样本时,总体均数与某指定数之间差别的假设检验
在大样本时,用样本标准差 S 近似替代总体标准差 , X 的分布近似正态分布,误差不大。但在小样本时,中心极限定理的条件不满足,同样用 S 替代 不能保证 X 的分布近正态分布。此时,适当的检验统计量应取 t =
nSX0 ~ t ( n -1)
(7 — 3)
而且正如前述那样,这个统计量服从自由度为 n -1 的 t 分布。
对于选定的显著性水平 ; 无效假设 H 0
:
=0的否定域为| t |≥2t ; 无效假设 H 0
:
≥0的否定域为 t≤-t α ; 无效假设 H 0
:
≤0的否定域为 t≥t α 。
例 例 7 — 3
已知某体育大学篮球专业男生 100 米跑的平均成绩
为 13.3 秒。该专业三年级一班的 12 名男生 100 米跑平均成绩为 13秒,标准差为 0.5 秒,问该班男生 100 米跑成绩与该专业男生 100 米跑成绩之间是否有显著性差异?
( =0.05)
解:(1)无效假设 H 0
:
=13.3 (2)计算统计量值:
| t |=nS| X |0 =125 . 0| 3 . 13 13 | ≈2.072 (3)取 =0.05, n ′ = n -1=12-1=11 ,查 t 值表知 t 0.05(11)
= 2.201 (4)判断结果:∵| t |< t 0.05(11)
∴P( H
0 )>0.05 ,接受 H 0
,认为三年级一班男生 100 米跑成绩与该专业男生 100 米跑成绩无显著性差异。
例 例 7 — 4
已知某运动饮料中,维生素 C 含量服从正态分布。按规定,维生素 C 的平均含量不得少于 21 毫克。现从一批饮料中抽取 17 罐,算知维生素 C 含量的平均值 X =23 毫克,S=3.98 毫克,问该饮料维生素 C 含量是五湖四海合格?
( =0.05)
解:(1)无效假设 H 0
: <21(假设维生素 C 含量不合格)
(2)计算 t 值:
t =nSX0 =1798 . 321 23≈2.072 (3)
=0.05,
n ′ = n -1=17-1=16, 查 t 值表知 t 0.05(16) =1.746
(按 = P(1)查表)
(4)判断结果:
t =2.072<1.746,小概率事件竟然发生了,所以拒绝 H 0
,从而认为该批饮料合格。
第三节
两个正态总体均数的假设检验
在实际工作中,两个总体平均值之差是研究人员常常感兴趣的一
个参数,在对这个参数的真值缺乏直接了解的情况下,可以根据样本数据来作判断。从两个总体中分别取出的两个独立随机样本所提供的信息是进行推断的依据。对两个总体平均值之差感兴趣的最常见的情形,就是要确定作出两个平均值不相等的结论是否合理。在这种情形下,检验既可以是双侧检验,也可以是单侧检验,而无效假设的形式分别为:
双侧检验:H 0
:1 =2
单侧检验:
H 0
:1 ≤2
或 H 0
:1 ≥2
一、方差21、22已知时,两个总体均数之差的假设检验
设有正态总体 N(1 ,21)和正态总体 N(2 ,22),其中21、22已知,为了检验 1 是否等于2 ,分别从两个总体中随机抽取样本含量为 n 1 和 n 2 的样本,其样本均数为 X 1 和 X 2 。
检验统计量为:
U = 2221212 12 1n n) ( ) X X (
(7 — 4)
公式(7—4)中的分母记作222121X Xn n2 1
取定显著性水平后 :
无效假设 H 0
:1 =2 的否定域为|U|≥ 2u ; 无效假设 H 0
:1 ≤2 的否定域为 U≥u; 无效假设 H 0
:1 ≥2 的否定域为 U≤-u。
例
7 — 5
已知用两种方法生产出来的拉力器的抗拉强度都近似服从正态分布。方法 1 给出的标准差为 6 千克,方法 2 给出的标准差为 8 千克。现有一个随机样本由方法 1 生产的 12 个产品组成,其平均抗拉强度为 40 千克,另一个随机样本由方法 2 生产的 16 个产品组成,其平均抗拉强度为 34 千克。问这两种方法所生产出来的拉力
器的平均抗拉强度是否不同?
( =0.05)
解:(1)无效假设 H 0
:1 =2
(2)计算 U 值:本例 n 1 =
12, 1 X = 40, 1= 6 n 2 =
16, 2 X = 34, 2= 8 在 H 0
成立之下,有1 -2 =0 |U| = 2221212 1n n| X X | = 16641236| 34 40 | ≈ 2.27
(3)取 =0.05,则2u =1.96 (4)判断结果:|U| > 1.96,拒绝 H 0
,认为两种方法所生产的拉力器的平均抗拉强度有显著性差异。
二、总体方差21、22未知,且为大样本时,两个总体均数之差的假设检验
由于总体方差未知,可以用样本方差这一无偏估计值代替。应用中心极限定理所必需的大样本可有理由认为,这样的估计值将令人满意,并且样本均数之差的总体近似服从正态分布。因此,检验统计量的公式:
U = 2221212 12 1nSnS) ( ) X X (
(7 — 5)
公式(7 — 5)中的分母记作:222121X XnSnSS2 1 否定域与以前形式类似。
例
7-6
由全国青少儿体质调查资料知天津市 158 名 18 岁女生肺活量的平均数为 2675 毫升,标准差为 357.8 毫升;而云南省 158
名 18 名女生的平均肺活量为 2621 毫升,标准差为 329.3 毫升。能否认为天津市 18 岁女生的平均肺活量比云南省女生的大?
( =0.05)
解:(1)无效假设 H 0
:1 =2
(2)计算 U 值:
n 1 =
158, 1 X = 2675, 1S= 357.8 n 2 =
158, 2 X = 2621, 2S= 329.3 ∴222121X XnSnSS2 1 =158) 3 . 329 (158) 8 . 357 (2 2
≈ 38.6856 |U| = 2 1 X X2 1S| X X | = 6856 . 382621 26765 ≈ 1.396
(3)取 =0.05,则2u =1.96 (4)判断结果:|U|<1.96,接受 H 0
,认为天津 18 岁女生的平均肺活量与云南的女生肺活量无显著性差异。
三、总体方差21、22未知,但21=22且为小样本时,两个总体均数之差的假设检验
这里21=22,称之为方差齐性。关于方差齐性的检验将在后面给出。
此时检验统计量为 t
= )n1n1( S) ( ) X X (2 12c2 12 1
(7 — 6)
其服从自由度为的分布。公式(7—6)的分母亦记作:
)n1n1( S S2 12cX X2 1 其中 2 n nS ) 1 n ( S ) 1 n (S2 122 221 12c 是两个总体公共方差的联合估计值,称为两个样本的合并方式差。
可看出,若21=22=2 ,2cS是对2 的两个估计值21S、22S的加权平均估计值。
对于显著性水平 , 无效假设 H 0
:1 =2 的否定域为| t |≥2t ; 无效假设 H 0
:1 ≤2 的否定域为 t ≥t; 无效假设 H 0
:1 ≥2 的否定域为 t ≤-t; 例 例 7 — 7
随机抽测某体校 122 名篮球队员,知其纵跳平均成绩为 61 厘米,标准差为 7.3 厘米:而抽测 10 名排球队员,知其纵跳平均成绩为 68 厘米,标准差为 6.2 厘米。问两专业学生的纵跳指标之间有无显著性差异?
( =0.05)
解:(1)无效假设 H 0
:1 =2
(2)计算 t 值:
n 1 =
12, 1 X =
61, 1S =
7.3 n 2 =
10, 2 X =
8,
2S =
6.2 ∴2 n nS ) 1 n ( S ) 1 n (S2 122 221 12c
=2 10 122 . 6 ) 1 10 ( 3 . 7 ) 1 12 (2 2 =
46.6075 |t|
=
)n1n1( S| X X |2 12c2 1
=
)101121( 6075 . 46| 68 61 | ≈ 2.395 (3)取 =0.05, n ′ = n 1
+ n 2 - 2=12 + 10–2 = 20 查知 t 0.05(20) =2.086 (4)判断结果:
| t |=2.395 > t 0.05(20) =
2.086,拒绝 H 0
,认为两个专业的纵跳指标之间有显著性差异。
例
7 — 8
现将各方面条件及技术水平基本相似的 12 名跳远运动员随机地分成两组,分别实施不同的训练,半年后,每人增长的成绩如下(单位:厘米):
甲
组
15
17
12
16
11
13 乙
组
8
9
9
10
8
7
试问两种训练的效果是否有显著性差异?
( =0.01)
解:(1)无效假设 H 0
:1 =2
(2)计算 t 值:本例 1 X =14,
21S =5.6,
2 X =8.5,
22S =1.1 |t|
= )n1n1(2 n nS ) 1 n ( S ) 1 n (| X X |2 1 2 122 221 12 1
= 31101 . 1 5 6 . 5 55 . 8 14 ≈ 5.205
(3)取 =0.01, n ′ = n 1
+ n 2 - 2=10 查 t 值表知t 0.01(10) = 3.169 查知 (4)判断结果:∵| t |=5.205 > 3.196 , ∴拒绝 H 0
,认为两种训练的效果有非常
显著的差异。
请注意,本例中甲、乙两个样本是互相独立的,没有内在联系。
四、两总体样本值成对出现,其总体方差21、22未知且为小样本时的假设检验(对同一批实验对象进行处理前后的显著性检验)
以上各段阐述的都是独立样本之间平均数差别的显著性检验方法,但有时从两个总体中分别抽出的样本并不相互独立,而存在一定的内在联系,并且数据是成对出现的。如分析测定参加体育运动者运动前后某些生理指标的变化,或为检验某一训练方法的实用效果,对同一批实验对象处在实施该训练方法前后观察某一指标的变化,等等。
总之,对于同一批实验对象处理前后的配对比较是作这类显著性检验的方法。如果是相互独立的样本则不可用这种配对比较的方法。
检验原理:假设对实验对象进行处理前后并无变化,而差别仅由抽样误差所致,则每个对象处理前后的差数的总体均数应等于零。这就是在配对比较方法中的无效假设 H 0
:d=0。
d=1 -2 ,是每对样本值的离差 d=x 1 -x 2
所在总体的均数。
若 x 1 和 x 2 服从正态分布,则 d 也服从正态分布,且为小样本,故检验统计量应为 t =ddSd =nSdd
(7 — 7)
式中:n) X X (ndd2 1
1 nn) d (d1 n) d d (S222d n 是数据对(x 1 , x 2 )的对数;
t 的自由度 n ′ = n -1; nSSdd是差数的平均数 的标准误。
例 7 — 9
对 10 名女生进行 3 个月的速度训练,训练前后测得每人的 60 米跑成绩(单位:秒)如表(7—2)中所示,问训练前后 60 米跑成绩的差异有无显著性意义?( =0.05)
表 表 7 7 — 2
本例训练前后 0 60 米跑成绩
编号
训练前( x 1 )
训练后( x 2 )
d = x 1 -x 2
d2
1
8.4
8
0.4
0.16 2
8.2
7.8
0.4
0.16 3
8.1
7.8
0.3
0.06 4
8.3
7.9
0.4
0.16 5
8.0
8.1
- 0.1
0.01 6
7.9
7.8
0.1
0.01 7
8.4
7.9
0.5
0.25 8
8.3
7.8
0.5
0.25 9
8.1
7.7
0.4
0.16 10
8.2
7.6
0.6
0.36
3.5
1.61
解:(1)无效假设 H 0
:d=0 (2)计算统计量值:
105 . 3ndd = 0.35
1 10105 . 361 . 11 nn) d (dS2 22d ≈ 0.2068 | t |=nSdd=2068 . 010 35 . 0 ≈ 5.352
(3)取 =0.05, n ′ = n
- 1=10 - 1=9 , 查 t 值表知t 0.05(9) = 2.262 (4)判断结果:| t | > t 0.05(9)
,拒绝 H 0
,认为经过 3 个月训练后,速度确有提高。
第四节
关于比率之间差别的假设检验
本节我们只介绍大样本的 U 检验法,它适用的条件为:
n >50 且样本率在 10% — 90%之间。这主要是因为在 n 足够大时,样本率的分布接近于正态分布。
一、一个总体率的假设检验
在检验样本率 P 是否从总体率为 的总体中所抽取时,其检验原理和步骤与一个正态总体均数的检验相似。此时若由大量调查和反复实验知道一总体率0,要检验样本所在总体的总体率是否就是0,也就是要检验的样本是否是从这个总体中抽取出来的。因此,无效假设为 H 0
:
=0 检验统计量应为
U = P0P = n) 1 (P0 00
(7 — 8)
对于选定的 , 无效假设 H 0
:
≥0的否定域为|U|≥2u ; 无效假设 H 0
:
≥0的否定域为 U≥u ; 无效假设 H 0
:
≤0的否定域为 U≤-u ; 例
7—10
某篮球队根据近期大量资料统计,比赛投篮命中率为 30%,现参加篮球联赛,5 场比赛共投篮 320 次,投中 110 次,问该队投篮命中率是否有所提高?( =0.05)
解:这是检验总体率是否为的问题。
(1)无效假设 H 0
:
=0.3 (2)计算 U 值:
0=0.3, P=320110=0.34375
|U|=n) 1 (| P |0 00 =3207 . 0 3 . 0| 3 . 0 34375 . 0 | ≈ 1.71 (3)取 =0.05,则2u =1.96 (4)判断结果:|U|<1.96,接受 H 0 。认为该队比赛投篮命中率并无真正提高。
二、两个总体率的假设检验
设 P 1
的从总体率为 1
的总体中随机抽出样本的样本率, P 2
是从总体率为 2
的总体中随机抽出样本的样本率。要检验 1
是否等于 2
,或 P 1 和 P 2 是否来自同一总体,作无效假设 H 0
: 1 =2
。在 H 0
成立时,近似有( P 1 - P 2 )~ N(0 , 2 1P PS)故有下式
U=2 1P P2 1SP P
(7 — 9)
式中:P 1 =11nk, P 2 =22nk ,两率差数的标准误
2 1P PS= )n1n1)( P 1 ( P2c c
而平均率 P C =2 12 2 1 1n np n p n=2 12 1n nk k,即 P C 是 P 1
、P 2 的加权平
均数。
n 1
、 n 2
为两样本的含量, k 1
、 k 2
为两样本中的事件发生次数。
对于选定的 :
无效假设 H 0
:1=2的否定域为|U|≥2u ; 无效假设 H 0
:1≤2的否定域为 U≥u ; 无效假设 H 0
:1≥2的否定域为 U≤-u ; 例
7 — 11
为研究运动项目对人体健康的作用,现收集到某年级甲、乙两班的体育活动及“达标”率资料。甲班 50 人,经常踢足球,达标测验通过 25 人;乙班 48 人,经常打篮球,达标测验通过22 人。试检验足球和篮球运动对提高身体素质的作用有无显著性差异? ( =0.05)
解:本例
P 1
= 11nk = 5025 = 0.5 P 2 = 22nk = 4822 = 0.4583 P C
= 2 12 1n nk k = 9847 = 0.4796 (1)无效假设 H 0
:1=2(甲、乙班所在总体达标率相同。)
(2)计算 U 值:
|U|=)n1n1)( P 1 ( P| P P |2 1C C2 1
=)481501( 5204 . 0 4796 . 04583 . 0 5 . 0 ≈ 0.413
(3)取 =0.05,则2u =1.96 (4)判断结果:|U|<1.96,即 P(H
0 )>0.05,接受 H
0 ,认为开展足球和篮球运动均能提高身体素质。
例 7 — 12
为探讨游泳与患慢性鼻炎有无关系,随机抽测游泳与田径两专业的学生进行对比,抽测结果见(表 7—3)。问患慢性鼻炎是否与专业有关?
( =0.01)
表 表 7 7 — 3
游泳与田径专业学生患鼻炎调查表
组
别
患病人数
未患病人数
合
计
患病率 游泳专业
20
60
80
0.25 田径专业
6
74
80
0.025
合
计
26
134
160
0.1625
解:本例
P 1
=0.25,
P 2 =0.075,
P C =0.1625 (1)无效假设 H 0
:1=2的否定域为
(两专业总体患病率无差异。)
(2)计算 U 值:
|U|=)n1n1)( P 1 ( P| P P |2 1C C2 1
=)801801( 8375 . 0 1625 . 0| 075 . 0 25 . 0 | ≈ 3.00 (3)取 =0.01,则2u = 2.58 (4)判断结果:|U|>2.58,拒绝 H 0 ,认为游泳与田径专业的患病率有非常显著的差异。从数据判断,患慢性鼻炎与游泳专业有关。
第五节
关于方差齐性的假设检验
一、一个总体方差的假设检验
检验步骤:
(1)建立无效假设 H 0
:2 =20(某已知数)
(2)计算检验统计量 2 =20n1 i2i) X X (=202s ) 1 n (
(7 — 10)
其中 S2
由取自正态总体的含量为 n
的样本算出。当无效假设真实时,这个统计量服从自由度为 n -1 的 2 分布。
(3)取定 ,
n ′= n -1 查2 值分布表确定22 / 与22 / 1
之值。
(4)判断结果:
若22 / 1 <2 <22 / ,则接受 H 0 ; 若2 ≤22 / 1 或2 ≥22 / 则拒绝 H 0 。
例 7—13
已知某学生的跳远成绩服从正态分布,并知其以往总体标准差 0= 8 厘米。最近抽测该生 10 次跳远,其标准差为 8.7厘米,试问它们之间的差异有无显著意义?
( =0.05)
解:(1)无效假设 H 0
:2 =
64 (2)计算 2 值:
2 =202s ) 1 n (=647 . 8 ) 1 10 (2 ≈10.64 (3)取 =0.05, n ′ = n -1=10-1=9 , 查2 值表知 :
22 / =2) 9 ( 025 . 0=19.02
22 / 1 =2) 9 ( 975 . 0=2.70 (4)判断结果:
现在,2.70<2 <19.02 , 故接受 H 0 ,认为 10 次所测跳远数据的方差与原总体方差无显著性差异,即该学生的跳远成绩还比较稳定。
二、两个总体方差的假设检验
前述在把 t 分布用于构造两个总体平均数之差的置信区间和用于两个总体均数的假设检验时,曾假定总体方差齐性。但总体方差是否齐性呢?如果对样本方差的考察导致总体方差不齐性的结论,就无法使用前述的 t 检验法。但在本章第六节中将给出修正的 t ′检验法。
对两个总体方差的检验,实际上是均数1 、2 未知,检验无效假设 H 0
: 21=22的问题。从两个总体中随机抽取出两个独立的样本,如果有21=22,由于21S和22S分别是21和22的无偏估计值,所以样本方差之比 F =2221SS
(7 — 11)
应接近于 1。
当 H 0 成立时,统计量 F 服从分子自由度为 n 1 -1 ,分母自由度为 n 2 -1 的 F 分布。
实际检验时,为了对两个方差在比较时计算与查表的方便,以较大的样本方差作为分子,即 F =2221SS ,这样一来样本方差之比将会大于 1。
为检验方便,统计学家计算列出了方差齐性检验用 F 值(见书后
附表 3),可查表得知检验临界值 F α( n 1′,
n 2′ )
的大小。其中 n 1 ′为对应较大均方的自由度, n 2 ′为对应较小均方的自由并。在通常教学中,只给出了 =0.05 时的 F 值表。
判断结果:若计算出的 F< F α( n 1′,
n 2′ ) ,则接受 H 0 ; 若计算出的 F≥ F α( n 1′,
n 2′ ) ,则拒绝 H 0 。
例
7—14
从两个正态总体中随机抽出两个含量分别为 10 和12 的样本,其标准差分别为 S 1 =5, S 2 =6,试检验无效假设 H 0
: 21=22是否成立?
( =0.05)
解:(1)无效假设 H 0
: 21=22 (2)计算 F 值:
F =22SS小大=2256=1.44 (3)取 =0.05, n ′ = n 2 -1=12-1=11 ,
n 2 ′ = n 1 -1=10-1=9 ,查 F 值表(书后表 3)知 F 0。05(11,9)
=3.87(或 3.96)
(4)结论:F
<F 0。05(11,9)
,接受 H 0 ,认为两个总体方差齐性。
第六节
方差不齐时,两总体均数差别的假设检验
当总体方差21、22未知且为小样本,但总体方差不齐时(21≠22)本章第三节第三段所讲的 t 检验法不可使用,这时,要采用下述修正的检验方法,即 t ′ 检验。
统计量为 t ′ 的计算公式为:
| t t ′ |=2X2X2 12 1S S| X X |=2221212 1nSnS| X X |
(7 — 12)
临界值为:
2X2X) n ( 05 . 02X) n ( 05 . 02X05 . 02 12211S St S t St
(7 — 13)
2X2X) n ( 01 . 02X) n ( 01 . 02X01 . 02 12211S St S t St
(7 — 14)
说明:
(1)无论样本含量大小,均按公式(7—12)计算 t ′ 值。
(2)查出必要的 t 值后,按公式(7—13)或(7—14)计算出近似的显著性界值。
例
7 — 15
抽测某敬老院 25 名男性老人与 20 名普通男子的血压资料(收缩压,毫米汞柱)为:老人:
n 1 =25 , 1 X =137, 21S=938;普通人:
n 2 = 20 , 2 X =128 ,22S =193 ,试问老人与普通人的血压差别有无显著性意义?
( =0.05)
解:1 1 . 本例两组样本方 差较大,先做方差齐性检验:
(1)无效假设 H 0
: 21=22 (2)
F =22SS小大=193938≈ 4.86 (3)取 =0.05, n 1 ′ = n 1 -1=24 ,
n 2 ′ = n 2 -1=19 ,查知 F 0.05(24,19)
≈2.51 (4)结论:F
<F 0.05(24,19)
,拒绝 H 0 ,认为两个总体方差齐性。
2 2 .进行两 总体均数的 t t ′ 检验:
(1)无效假设 H 0
:2 1 (21≠22) (2)计算 t ′ 值:
| t ′ |=2221212 1nSnS| X X |=2019325938128 137 ≈ 1.31 (3)取 =0.05, n 1 ′ =24 , n 2 ′ =19 ,查 t 值表知 F 0.05(24)
=2.064 , F 0.05(19)
=2.093 ,所以
2019325938093 . 220193064 . 225938t05 . 0 ≈2.07 (4)判断结果:| t ′ | <t ′ 0.05 ,接受 H 0 ,认为老人与普通人的血压总体均数之间无显著性差异。
第七节
假设检验注意事项及说明
一、小结
本章所讨论的是假设检验的基本概念和方法。已经知道,假设检验过程可大致分为:
(一)陈述无效假设 H H 0 0
;
(二)识别检验统计量及及其分布;
(三)选定显著性水平
;
(四)收集数据并完成计算;
(五)作出统计决策。
已经了解,在很多假设检验方法中。可以用下面的一般公式去计算检验统计量:
检验统计量 = (样本统计量)-(被假设参数)
统计量的标准误差 关于选用检验方法,应注意:
1 1 .有几个总体?
2 2 .总体方差是否已知?
3 3 .是大样本还是小样本?
注意到这三点,基本上就能选出正确的假设检验方法了。当然,在检验开始前及进行中,仍需注意下面所述各项。
二、进行假设检验时应注意的问题
(一)进行假设检验时,要注意比较资料的可比性
即要考虑到其他可能影响观测指标的因素,应尽量要求除了对比的主要因素外,其他基本条件要齐同。
(二)要根据资料的特点及 分析目的去选用相应的检验方法
如:对均数进行 t 检验,有两个必要条件:1.总体为正态分布。若总体为正态分布,则样本含量 n 无论大小都可以使用 t 检验;若总体分布不呈正态,则当 n 足够大时,可用 U 检验; 2.两个总体方差齐性,即21=22,若两个总体方差不齐时,则只能用 t′ 检验来替代 t 检验。
(三)差别显著性水平的高低并不等于实际判别的大小
如 =0.01 比 =0.05 水平高,但均数差别不一定就大。很能明显,同一例子的实际差别是定的,而水平则是由研究者取的!
又如:两个均数的差异有非常显著的意义,也并不意味着两个均数之间的实际差别很能大,而反映存在着差异的可能性很能大。
总之,统计上的检验结果并不一定就是实际的差别,所以下结论时要慎重。应结合专业知识及以往的经验教训去判断结果。
(四)显著性检验判断结果都是相对的,即检验结果并不是绝对的
也就是说,检验所作的结论有可能是错误的判断。
统计上习惯用 P = 0.05 这个人为界限来区分是否小概率事件,但大家都已知道,这仍有 5% 犯第Ⅰ类错误的可能。
有人可能会把显著性水平
取得更高些,如取 =0.01。
此时虽然犯第
类错误的概率小了,但正如前所述,犯第Ⅱ类错误的概率则增大了!
因此,在下统计结论时,不可绝对化,应留有余地。如不要写“经过统计学处理有(无)差别”,而应持科学的态度写明“差别有(无)显著性意义”。
(五)在实例计算中已看到,随着显著性水平
的变化,临界值会变化,检验结论也有可能改变,所以当计算出的检验统计量之值和所取
水平的临界值较接近时,下结论更要慎重。此时最好不作判断,而考虑扩大样本再作统计分析,以便使结论更可靠。
注意此时一定要采取实事求是的科学态度,绝不可以利用一些人
为方法(如改变精确度等等)使用权数据改变以迎合自己的主观愿望。
三、假设检验与区间估计实质上是一个问题的两种提法。也可以用第六章中论述过的区间估计方法来检验假设。
例如,假定想在某一显著性水平 之下检验无效假 H 0
: =0 和对立的备择假设 H 1
: ≠0
此时除了采用本章所述方法外,还可以通过对 构造 100(1- )%置信区间的方法来检验这个假设。如果这样构造出来的区间包含0
,就不否定 H H 0
;而如果这一区间不包含0
,就否定 H H 0
。
用例 7—1 的数据可说明这一点。该例中 的 95%置信区间为:
364 . 696 . 1 5 . 69n96 . 1 X
71.6
67.4 即(67.4, 71.6),因为0 = 72,未包含在这一区间内,所以否定H 0
。这一结果与假设检验方法所得出的结果相同。
习
题
七
1.假设检验的目的是什么? 2.假设检验的原理是什么? 3.进行假设检验时为什么还会犯错误?可能会犯哪些类型的错误? 4.进行假设检验时应注意哪些问题? 5.在检验一个总体的平均值时,用 t 作检验统计量的基本假定是什么?检验两个总体平均值之差时的情况又如何? 6.从个人感兴趣的领域中举出一个适于作关于两个总体平均值之差的假设检验的例子。利用实际数据完成假设检验过程。
7.由全国青少年体质调查资料知城市 10 岁男生的平均身高为135.3 厘米,标准差为 5.75 厘米。今从某小学随机抽取 20 名 10 岁男生的身高平均数为 132 厘米,试问该小学 10 岁男生的身高与全国
10 岁男生的身高有无显著性差异?
( =0.05)
8.由全国青少年体质调查资料知北京市 205 名 11 岁男生身高的平均数为 143.3 厘米,标准差为 5.76 厘米;坐高的平均数为 76.3 厘米,标准差为 2.76 厘米,上海市 208 名 11 岁男生平均身高为 142 厘米,标准差为 5.9 厘米;平均坐高为 75.8 厘米,标准差为 3.01 厘米。试部两市 11 岁男生的平均身高、平均坐高有无显著性差异? ( =0.05)
9.已知全国城市 7 岁男生身高平均数为 117.3 厘米。抽测北京市 205 名 7 岁男生身高的平均数为 118.3 厘米,标准差为 4.8 厘米,试检验北京市 7 岁男生身高与全国的有无显著性差异?( =0.01)
10.已知某区 10 岁男生立定跳远的平均成绩为 150.6 厘米,从中随机抽测 20 人的立业跳远的样本统计量为:
X
= 167.1 厘米,S = 26.41 厘米,试检验这 20 名 10 岁男生立业跳远的成绩是否与该区的一样?( =0.05)
11.某年级一班 9 名男生 1500 米跑的平均成绩为 5 分 15 秒,标准差为 15 秒;二班 16 名男生 1500 米跑平均成绩不 5 分 10 秒,标准差为 20 秒。试问两班男生 1500 米跑的成绩有无显著性差异? ( =0.05)
12.将条件相似的 10 名跳远运动员随机分成两组,分别进行不同的训练后,其增长的成绩如下(单位:厘米):
一组:16, 13, 12, 15, 10 ; 二组:8,
7,
9,
6,
6 试检验这两种训练效果是否有显著性差异?( =0.01)
13.测知 10 名少年运动员训练前后每人的纵跳成绩如下(单位:厘米):
编号
1
2
3
4
5
6
7
8
9
10 训练前
60
50
48
48
50
58
58
50
57
49 训练后
64
53
46
53
47
60
62
53
61
52
问训练前后纵跳成绩有无显著性差异?( =0.05)
14.结坚持太极拳锻炼的高血压患者,进行疗效统计。男 56 人,其中有效者 46 人;女 44 人,其中有效者 33 人,试比较太极拳锻炼对男、女高血压患者的疗效有无显著性差异?( =0.05)
15.已知某少年 60 米跑的成绩服从正态分布,现随机抽测 10 次,其成绩(单位:秒)如下:
10.2,
9.7,
10.1,
10.3,
10.1 9.8,
9.9,
10.4,
10.3,
9.8 试检验无效假设 H 0
: 2 =0.03 是否成立?( =0.01)
16.下表中的结果来自两个独立的随机样本:
样
本
n
X
s 样 本 1
10
20
5 样 本 2
12
24
6
(1)试检验无效假设 H 0
: 21=22是否成立?( =0.05)
(2)试检验无效假设 H 0
: 1 =2 是否成立?( =0.05)
(3)假定 21=22,求1 -2 的 95% 置信区间。