资源简介 (共22张PPT)第八章 假设检验*8.4 总体分布假设检验的 检验法2c内容简介: 给出关于总体的分布类型的假设检验方法, 这是非参数假设检验问题. 这些方法在解决实际问题中首先得到使用. 在确定了总体服从正态分布后,才可以利用先前学习的关于均值、方差的区间估计方法和假设检验方法.第八章 假设检验*8.4 总体分布假设检验的 检验法2c8.4.1 问题提出前面我们讨论了当总体分布形式已知时, 对正态总体中未知参数的假设检验. 而当总体分布类型未知时, 则需要根据样本观察值对总体的分布进行推断, 这就是总体分布的拟合优度检验. 拟合检验法不止一种, 本书只介绍其中最常用的皮尔逊(Pearson)的 检验法.皮尔逊资料8.4.2 预备知识假设检验, 检验法, 频数, 频率, 直方图, 上分位点 , 最大似然估计.2c这里F0(x)是待接受的总体分布函数, 现在已知, 但其中所含的参数可以未知. 关于分布函数F0(x)中的未知参数, 可先利用最大似然法求出其估计值, 然后再接着进行总体分布的假设检验.(8.4.1)设总体X的分布函数F(x)未知, 为来自该总体的样本. 检验假设:8.4.3 方法研究检验法2c总体分布假设检验的 检验法2c若总体为离散型, 则需检验假设:H0: 总体X的分布律为P{X=xi}=pi, i=1, 2, … (pi已知). (8.4.2)若总体为连续型, 则待检验假设是H0: X的概率密度为 f(x) (f(x)已知).(8.4.3)至于概率密度f(x)或分布律的具体形式, 可由经验或根据样本的观测值,利用直方图来推测.检验法的基本思想是:将随机试验的可能结果的全体分为k 个互不相容的事件 ,在 成立的条件下计算, i=1,2,…, k. 在n次试验中,事件出现的频率 (其中 )与 常有差异, 但由伯努利大数定律可知, 如果试验次数很多, 在成立的条件下, 的值应该比较小. 过大就应该拒绝H0 .基于此, 皮尔逊选用检验统计量(8.4.4)并证明了如下定理.定理 若n充分大(一般要求n≥50),则当 成立时, 不论总体X服从何种分布, 统计量(8.4.4)近似地服从自由度为k-r-1的 分布.其中r 是待检验分布中未知参数的个数.若 , 则拒绝 , 否则,接受 .在H0成立时, 利用样本数据可计算(8.4.4)中 的观测值, 对于给定的显著性水平 , 查表得注意:概率pi的确定:当待接受的总体分布律或概率密度已知时即可得到pi;当待接受的总体分布律或概率密度未知时,通过最大似然估计法计算得到pi .检验法实施步骤是:(1) 提出原假设 : (或: 服从某种分布);(2) 将实数轴分为 个不相交的区间其中 可取至-∞, 可取至+∞, 一般取5≤k≤16;(3) 计算观测值频数 , 即 个样本观测值 , …, 中落入第i个区间( , ]中的个数 (i=1,2,…,k);(4) 在 成立的条件下, 计算X 落入各区间的概率 ,进而得到理论频数 (i =1, 2, …, k);(5) 将 , 代入(8.4.4) 求出 的值;(6) 查 分布表得 ;(7) 作出推断结论: 若 ,则拒绝 , 否则可接受 .应注意的是, 利用 检验法时一般要求≥5(i=1,2,…,k), 否则应适当地将相邻的区间合并, 以满足此要求.例8.4.1 检验6.2节例6.2.3中刀具寿命是否服从正态分布 取显著性水平 =0.05.解 根据频率直方图的分布形状, 我们可以推断总体“可能服从正态分布”.8.4.4 方法应用以随机变量X 表示刀具寿命, 需要检验原假设待检验正态总体中的两个参数μ与 都是未知的, 我们先用最大似然法求其估计值:将例6.2.3中的样本观测值代入上述公式, 计算得到所以,现在需要检验假设将实数轴分为10个区间 , 第一个区间是(-∞, 339.5], 最后一个区间为(363.5, +∞) ,其它各区间保持不变 .下面计算落入各区间的概率.i=1,2,…,10.类似地, 计算可得的 值.结果见表8-1.通用公式:具体计算各区间概率,得到:表8-1 例8.4.1频率,概率与统计量值组号 区间 ni pi npi (ni-npi)2/npi12 (-∞, 339.5](339.5, 342.5] 0.01830.046 0.02883 (342.5, 345.5] 11 0.1093 10.93 0.00044 (345.5, 348.5] 18 0.1858 18.58 0.01815 (348.5, 351.5] 24 0.2277 22.77 0.06646 (351.5, 354.5] 20 0.1981 19.81 0.00187 (354.5, 357.5] 12 0.1295 12.95 0.06978910 (357.5, 360.5](360.5, 363.5](363.5,+∞] 0.05970.01970.0059 0.0259合计 100 0.2111所以,接受 , 即认为刀具寿命服从正态分布N(350.38, 5.22).合并后区间个数 k =7, 这里有两个待估参数, 故 r =2. 对于α=0.05, 查表得因为讲评(1) 要解决的问题是“刀具寿命是否服从正态分布 ”,提示我们应该进行总体分布类型的假设检验,人们常用“总体分布的假设检验法”. (2) 施行“总体分布的假设检验法”的 步骤,提示读者分解划分, 注意处理npi≥5和5≤k≤16.(3) 在理论上得到了可以接受的 结论“认为刀具寿命服从正态分布 N(350.38, 5.22)”, 我们就知道了正态总体的均值为350.38, 其方差为5.22. 当然,也可以再对其进行假设检验,计算有关的估计可信度、估计的误差精度等问题.(4) 由于接受了结论 “认为刀具寿命 服从正态分布N(350.38, 5.22)” , 我们完全 可以进一步分析、讨论和预测该正态总体的概率问题. 例如进一步结合第七章的区间估 计, 结合第八章的假设检验, 结合第九章的线性回归分析等知识进行数据统计分析.8.4.5 内容小结(1) 关于总体分布类型或者分布表达式 的确定, 常用χ2检验法; (2) χ2检验法与直方图结合使用; (3) F0(x)中可以含有待定参数, 用最大 似然法求得; (4) 注意处理npi≥5和5≤k≤16.卡尔·皮尔逊(Karl Pearson, 1857~1936), 英国数学家、哲学家, 现代统计学的创始人之一, 被尊称为统计学之父. 许多熟悉的统计名词如标准差, 成分分析,卡方检验都是他提出的. 展开更多...... 收起↑ 资源预览