单个平均数假设测验
§4.1 假设检验的基本方法
现在我们从一道例题入手,看看假设检验的基本做法和其中所涉及的一些理论性问题。
3.1 某地区10年前普查时,13岁男孩子平均身高为1.51m,现抽查200个12.5岁到13.5岁男孩,身高平均值为1.53m,标准差0.073m,问10年来该地区男孩身高是否有明显增长?分析:从题目知10年前总体均值μ1=1.51m。现在抽取200个个体,得样本均值m,样本标准差S=0.073m。现在总体均值μ未知。题目要求判断μ>10岁男孩μ1是否成立。
解决方法:
(1)先假设μ=μ1=1.51m
(2)样本来自已知总体可能性有多大
(3)根据可能性大小判断假设是否正确。
a)如果这可能性很大,我们只能认为μ与μ1差别不大,即μ=μ1很可能成立。
b)若可能性很小,则说明在假设μ=μ1成立的条件下,抽出这样一个样本的事件是一个小概率事件。小概率事件在一次观察中是不应发生的,但它现在发生了.
小概率事件事实上发生的合理的解释就是它本不是小概率事件,是我们把概率算错了。而算错的原因就是我们在一开始就做了一个错误的假设μ=μ1。换句话说,此时我们应该认为μ>μ1,即男孩身高有明显增长。这就是假设检验的基本思路。
需要明确以下几个问题
1°假设的建立。零假设:记为H0,针对要考查的内容提出。本例中可为:H0: μ=151。它通常为一个数值,或一个区间(例如可能为H0:u≤151)。
原则为:a)通常是问题的反面,某个新品种与老品种没有差异、新的培养基无效、现在儿童身高与过去无差别处理无效)、b)通过统计检验决定接受或拒绝H0后,可对问题作出明确回答;C)要能根据H0建立统计量的理论分布。
备择假设:记为HA,是除H0外的一切可能性的集合。这里强调一切可能值是因为检验只能判断H0是否成立,若不成立则必须是HA。HA通常是一个区间。例如当H0取为 μ=151时,H
A应取为μ≠151。当H0取为μ≥151或μ≤151时,HA则应相应取为μ<151或μ>151
备择假设原则为:a)应包括除H0外的一切可能性;b)如有可能,应缩小备择假设范围以提高检验精度。此时若有理由认为μ>151或μ<151不可能出现,也可只取HA为可能出现的一半,即μ<151或μ>151,这样可提高检验精度(原因参见单侧与双侧检验)
2°小概率原理:小概率事件在一次观察中不应出现。这是一切统计检验的理论基础。
注意:小概率事件不是不可能事件。观察次数多了,它迟早会出现。因此“一次”这个词是重要的。
§3.3 正态总体的假设检验
检验对象 本节开始介绍对正态总体进行假设检验的具体方法。从正态分布的密度函数可知,正态总体只有两个参数,这就是期望μ和方差σ2。因此我们的检验主要也是针对这两个参数进行。
检验类型:单样本检验就是全部样品都抽自一个总体,检验目的通常是μ或σ是否等于某一数值;
双样本检验则是有分别抽自不同总体的两个样本,检验的目的是看这两个总体的μ或σ是否相等。或新品种农作物是否比旧品种产量更高等等,此时都应该采用双样本检验的方法。
如果我们需要考虑三个以上总体,则应采用第四章介绍的方差分析的方法。
一、单样本检验步骤
1°建立假设,包括H0与HA
一般来说,H0取值有三种可能:μ=μ0,μ≤μ0,或μ≥μ0。这里μ0是一个具体数值。注意H0的表达式中必须包含等号,因为我们实际上就是根据这个等号建立理论分布的。μ0数值的确定:a)凭经验;b)根据某种理论可以计算;c)实际问题要求。至于H0中是否包含大于或小于号则主要看实际问题的要求。
HA也有相应三种:μ≠μ0,μ>μ0,或μ<μ0
当H0取为μ=μ0,HA:μ≠μ0(包括μ>μ0和μ<μ0),由专业知识可知μ>μ0,或μ<μ0中有一种不可能出现时,可选择另一种为HA。此时也相当于单尾检验。注意HA应包括除H0外的一切
可能值。在有专业知识可依据的情况下,应优先选取单尾检验,因为这样可提高检验精度。需要强调的是选择单尾的依据必须来自数据以外的专业知识或实践要求,而不能来自数据本身。
2°选择显著性水平α。
α最常用的数值是0.05。当我们计算出统计量的观测值出现的概率大于0.05时,我们称之为“没有显著差异”,并接受H0;当小于0.05时,我们称之为“差异显著”,并拒绝H0
一般情况下,此时我们应进一步与0.01比较,若算出的概率也小于0.01,则称“差异极显著”,此时我们拒绝H0就有了更大把握。需要特别强调的是我们一般都取α=0.05,这只是一种约定俗成,理论上并没有任何特殊意义。
3°选择统计量及其分布。
检验均值一般选择为统计量,各种情况下的统计量理论分布如下:
总体方差σ2已知:使用u检验,统计量服从正态分布。
                                        (3.10)
b) 总体方差σ2未知:应使用t检验,统计量服从t分布。
t(n-1)                                        (3.11)
4°建立拒绝域。
根据统计假设确定是单侧检验还是双侧检验,根据统计量的分布,选定的α值查出t或u临界值,从而建立拒绝域。注意u分布和t分布的密度函数关于y轴对称,如果是双侧检验可取绝对值与临界值比;如果是单侧检验则应区分下单尾是小于负临界值拒绝H0,上单尾则是大于正临界值拒绝H0
5°计算统计量,并对结果作出解释。
把样本观测值代入统计量公式,求得统计量取值,检查是否落入拒绝域。若没落入则认为“无显著差异”,接受H0;若落入α=0.05的拒绝域,则应进一步与α=0.01的拒绝域比较,若未落入,则认为“有显著差异,但未达极显著水平”,拒绝H0;若也落入α=0.01拒绝域,则认为“有极显著差异”,拒绝H0。最后,根据上述检验结果对原问题作出明确回答。
3.1 某地区10年前普查时,13岁男孩平均身高为1.51m。现抽查200个12.5岁至13.5岁男孩,身高平均值为1.53m,标准差S=0.073m,问10年来该地区男孩身高是否有明显增长?
解:分析:由于生活水平提高,孩子身高只会增加,不会减少。同时,题目也是问身高是否有增长,因此可用单侧检验。
  H0:μ=151;HA:μ>151
查表,得df=199, α=0.05t单侧分位数为:t0.95(199)t0.95(180)=1.653;α=0.01的单侧分位数为:t0.99(199)t0.99(180)= 2.347
t > t0.99 ,∴有极显著差异,拒绝H0,即:应认为10年来该地区男孩高有明显增长。
当分布表中不能到恰好相同的自由度时,可选取表中最接近的值代替,也可以取接近的几个值进行插值计算得出近似值。
3.2  已知某种玉米平均穗重μ0=300g,标准差σ=9.5g,喷药后,随机抽取9个果穗,重量分别为(单位为g):308,305,311,298,315,300,321, 294,320。问这种药对果穗重量是否有影响?
解法: 可认为喷药不影响穗重标准差,σ仍为9.5。因此可采用u检验。
H0:μ=300; HA:μ≠300
查正态分布表,得:U0.975=1.96,  U0.995=2.58。U > U0.975,但U < U0.995差异显著,但未达极显著水平,应拒绝H0,可认为药物对穗重有影响。
解法2:直接使用T检验:
H0:μ=300; HA:μ≠300
     
     
查t分布表,得:t0.975(8) = 2.306,  t0.995(8) = 5.841, t0.975 <t < t0.995, 差异显著,但未达极显著水平,拒绝H0,药物对果穗重量有影响。
引出一个问题:t检验与u检验哪种解法更好
t分布的分位数比正态分布大,说明t检验不如u检验精确,原因就是t检验中的S是根据一个小样本估计的,它本身也有误差;而u检验中的σ是已知的总体参数,它是准确的,不再包含任何其他误差了。考虑到S中误差的影响t检验的精度确实会有所下降,因此它的分位数才会比正态分布大,而且自由度越小与正态分布的差别就越大。
关于如何选择这这两种方法,回答应当是:如果象本题这样σ2没有改变的可能性很大,最好用第一种方法;σ2已有改变,那当然应用第二种方法;如果不能明确σ2有没有改变,我自己倾向于使用第二种方法。
χ2检验可用来检验σ2是否改变
4°单侧与双侧检验
单侧检验:拒绝域为μ>151(或μ<151)
  -uα/2            uα/2                                      uα
          双侧                        单侧
双侧检验:拒绝域为μ≠151
                          图3.2 双侧与单侧检验
双侧检验时拒绝域分为两块,但阴影部分总面积是与单侧检验相同的,因此,这样在α相同时,单侧检验的β值小于双侧检验, 即单侧检验优于双侧检验。这是因为我们使用了额外的知识排除了一种可能性。