资源简介 (共32张PPT)第八章 假设检验8.1 假设检验的基本问题第八章 假设检验8.1 假设检验的基本问题内容摘要:应用小概率原理和给定的显著性水平,提出判断决策的两类错误,得到三种不同的假设检验的拒绝域,从而建立了假设检验的方法与理论. 假设检验方法对于确定总体均值或方差是否出现显著性的变化具有实际的应用价值,在科技论文中应用得也较广泛.8.1.1 提出问题第七章我们介绍了求总体参数的点估计 和区间估计的方法,这一章我们介绍另一类重要的统计推断问题——假设检验.问题:(1) 这次学生的《高等数学》考试平均成绩是不是可以认为78分呢 (2) 计算机工程学院的《概率统计》课程考试是不是比建筑工程学院的同科考试成绩更稳定些?或说更好些呢?引理1:小概率原理,实际推断原理.8.1.2 预备知识若总体引理2:,则小概率事件在一次试验中几乎是不可能发生的, 如果在一次试验中发生了, 我们就认为它不是一个小概率事件.或者8.1.3 问题分析假设检验是统计推断的一个基本问题,在总体的分布函数完全未知或只知其形式但不知其参数的情况下,为了推断总体的某些性质,先对总体的分布类型或总体分布的参数做某种假设,然后根据样本提供的信息,对所作的假设作出是接受,还是拒绝的决策,这一过程就是假设检验.1. 何谓假设检验假设检验参数假设检验非参数假设检验总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题2. 假设检验的分类参数假设检验是总体分布的类型为已知,但有一个或几个参数未知, 只要确定了未知参数, 也就完全可以确定总体的概率分布.(1) 参数假设检验我们只能拿一部分钢筋得到一组折断力的数据, 以此来推断这批钢筋是否合格.这种总体的分布类型已知,仅对总体分布的未知参数提出假设的检验问题即为参数假设检验.均未知,现要检查某钢厂生产的钢筋是否达到标准(标准为折断力均值 ),例 已知钢筋折断力服从另一类是我们不知道总体分布的具体类型. 例如, 研究某建筑物承受的载荷时,测量了不少数据,这时想从数据来判断载荷是否服从正态分布.我们要回答的问题是“是正态分布”或者“不是正态分布”,这种对总体的分布表达式或分布类型提出的检验问题,称为非参数假设检验.(2) 非参数假设检验引例 某酒厂的瓶酒灌装机在正常工作时, 每瓶酒的质量X是一个随机变量,并且它服从正态分布 (单位kg). 某日随机地抽取9瓶酒,称得质量为:8.1.4 建立理论问机器工作现在是否正常?1. 假设检验的基本概念及原理思考题 怎样才能认可机器现在工作状态是正常的呢?问题是根据样本值来判断还是为此,我们提出两个相互对立的假设以 分别表示这一天瓶酒重量总体 X的均值和方差.比较稳定,我们就设由于长期实践表明,方差则X~N( ,0.0152),其中称为零假设或原假设,用H0表示.(1)提出假设:机器工作不正常这里μ未知.而称为备择假设,用H1表示.根据这一法则, 利用已知样本作出决策是接受假设H0(即拒绝假设H1)还是拒绝假设H0(即接受假设H1).即认为机器工作正常. 否则, 认为是不正常的.那么, 我们用怎样的法则才合理呢 如果作出的决策是接受H0,则认为(2)提出判别“机器工作不正常”标准(3)判别标准: 合理,大家都遵守、接受然后,我们给出一个合理的法则,因此,标准化随机变量如果H0为真, 则根据引理2, 知道设下应该是小概率事件.取较大值在H0为真的假所以,其中k是某一常数若小概率事件发生了,即由实际推断原理“小概率事件在一次试验中几乎不发生”, 现在我们有理由怀疑H0的正确性而拒绝原假设H0, 反之就接受原假设H0.这是在H0成立的条件下导出的一个违背“小概率原理”的结论, 这表明假设H0是不正确的, 因此拒绝H0, 否则只好接受H0.小概率事件在一次试验中几乎是不发生的,如果在一次试验中发生了,我们就认为它不是一个小概率事件.犯第二类错误的概率记为(2) 两类错误先来看两个假设检验的错误. 因为我们做决策依据的是一个样本, 是以部分数据来推断总体性质, 因此不可避免地会犯两类错误.第一类错误(弃真错误): H0为真而拒绝H0;第二类错误(取伪错误): H0不真而接受H0 .犯第一类错误的概率记为我们当然希望犯两类错误的概率都很小, 但是, 进一步讨论可知, 当样本容量固定时, 若减少犯一类错误的概率, 则犯另一类错误的概率往往增大. 若要使犯两类错误的概率都减小,则须增加样本容量. 实际上, 增加样本容量, 往往要增加成本.在给定样本容量的情况下, 一般来说, 我们总是控制犯第一类错误的概率.这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率的检验,称为显著性检验.即令通常取等.是一个事先指定的很小的概率,通常取 等比较小的正数, 称为显著性水平或检验水平.(3) 确定判断标准由标准正态分布上 分位点的定义,由由于H0为真时,为了确定常数k,即取下式成立:所以,得由(8.1.2)式知, 我们得到拒绝H0的判断关系:我们参考标准正态分布的上分位点示意图.例如, 在引例 中取则因为2.2>1.96,于是拒绝H0,即认为机器工作现在不正常,应该停机立即查找原因.统计量称为检验统计量.当检验统计量取某个区域C中的值时,我们就拒绝原假设,则称区域C为拒绝域,拒绝域的边界点称为临界点.已知算得参数假设检验主要有三种类型:H0 : = 0 , H1: ≠ 0 ;双边假设检验右边假设检验H0 : ≤ 0 , H1: > 0 ;单边假设检验左边假设检验H0: ≥ 0 , H1: < 0 .2. 三种假设检验的拒绝域设是来自总体为已知,显著性水平为(1) 双边检验的拒绝域我们来求检验问题H0: ≥ 0 , H1: < 0的拒绝域.(2) 左边检验的拒绝域往往偏小才能拒绝H0,因此,拒绝域的形式为因H0中的 全部都比H1中的 要大,观察值因为假设故事件的发生一定导致事件的发生,故(k是某一正数) .故要使式子P{当H0为真时拒绝H0}成立,只需令概率比较大者注意到得到拒绝域为, 所以分位点的定义知(因为由标准正态分布的上又由于整理,由原来分析(k是某一正数),变形得到,的拒绝域为(3) 类似地,可以求得右边检验问题H0 : ≤ 0 , H1: > 0.8.1.5 方法应用更新设备后, 从新生产的产品中随机抽取100个,若方差没有变化,设备更新后产品的平均质量是否较以往有显著提高 测得样本均值(单位:g).例8.1.1 某种产品质量取显著性水平α=0.05.思考题 方差是否已知?问题是双侧检验还是单侧检验?因此拒绝H0, 即在 的显著性水平下, 认为产品平均质量有显著提高.所以拒绝域为解 提出假设H0 : ≤ 0 = 42, H1: > 0 .因为 , 查表得 .计算得综合上述,可得处理参数的假设检验问题的步骤如下:(1) 根据问题提出合理的原假设H0和备择假设H1;(一般较小0.05,(2) 给定显著性水平0.01等);(3) 选取合适的检验统计量(它的抽样分布中不含任何未知分布)及确定拒绝域的形式;(4) 令求拒绝域;(5) 由样本值计算检验统计量的值,然后作出决策:拒绝H0或接受H1.在假设检验中, 拒绝域的确定至关重要, 而拒绝域与备择假设、检验统计量和显著性水平有关.8.1.6 内容小结提出问题: (1) 这次学生的《高等数学》考试平均成绩 是不是可以认为是78分 (2) 计算机工程学院的《概率统计》课程考 试是不是比建筑工程学院的同科考试成 绩更稳定些?或者说更好些呢?提出现实问题:均值,方差分析问题1:提出假设,寻找判定法则,确定结论.建立理论和方法: 假设检验方法5步骤.分析问题2:一个显著性检验水平,两个假设,两类错误,三种拒绝域.解决问题存在问题:(1) 总体方差未知时如何应用呢?(2) 对于两个正态总体的均值变化,如何进行 检验呢? 展开更多...... 收起↑ 资源预览