Ch8-4总体分布假设检验的χ2 检验法 课件(共22张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源下载
  1. 二一教育资源

Ch8-4总体分布假设检验的χ2 检验法 课件(共22张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源简介

(共22张PPT)
第八章 假设检验
*8.4 总体分布假设检验的 检验法
2
c
内容简介: 给出关于总体的分布类型的假设检验方法, 这是非参数假设检验问题. 这些方法在解决实际问题中首先得到使用. 在确定了总体服从正态分布后,才可以利用先前学习的关于均值、方差的区间估计方法和假设检验方法.
第八章 假设检验
*8.4 总体分布假设检验的 检验法
2
c
8.4.1 问题提出
前面我们讨论了当总体分布形式已知时, 对正态总体中未知参数的假设检验. 而当总体分布类型未知时, 则需要根据样本观察值对总体的分布进行推断, 这就是总体分布的拟合优度检验. 拟合检验法不止一种, 本书只介绍其中最常用的皮尔逊(Pearson)的 检验法.
皮尔逊资料
8.4.2 预备知识
假设检验, 检验法, 频数, 频率, 直
方图, 上分位点 , 最大似然估计.
2
c
这里F0(x)是待接受的总体分布函数, 现在已
知, 但其中所含的参数可以未知. 关于分布函数F0(x)中的未知参数, 可先利用最大似然法求出其估计值, 然后再接着进行总体分布的假设检验.
(8.4.1)
设总体X的分布函数F(x)未知, 为来自该总体的样本. 检验假设:
8.4.3 方法研究
检验法
2
c
总体分布假设检验的 检验法
2
c
若总体为离散型, 则需检验假设:
H0: 总体X的分布律为
P{X=xi}=pi, i=1, 2, … (pi已知). (8.4.2)
若总体为连续型, 则待检验假设是
H0: X的概率密度为 f(x) (f(x)已知).(8.4.3)
至于概率密度f(x)或分布律的具体形式, 可由经验或根据样本的观测值,利用直方图来推测.
检验法的基本思想是:
将随机试验的可能结果的全体分为k 个互
不相容的事件 ,在 成立的条件下计算
, i=1,2,…, k. 在n次试验中,事件
出现的频率 (其中 )与 常有差异, 但
由伯努利大数定律可知, 如果试验次数很多, 在
成立的条件下, 的值应该比较小. 过大就应该拒绝H0 .
基于此, 皮尔逊选用检验统计量
(8.4.4)
并证明了如下定理.
定理 若n充分大(一般要求n≥50),则当 成立时, 不论总体X服从何种分布, 统计量(8.4.4)近似地服从自由度为k-r-1的 分布.其中r 是待检验分布中未知参数的个数.
若 , 则拒绝 , 否则,
接受 .
在H0成立时, 利用样本数据可计算(8.4.4)中 的观测值, 对于给定的显著性水平 , 查表得
注意:概率pi的确定:当待接受的总体分布律或概率密度已知时即可得到pi;当待接受的总体分布律或概率密度未知时,通过最大似然估计法计算得到pi .
检验法实施步骤是:
(1) 提出原假设 : (或
: 服从某种分布);
(2) 将实数轴分为 个不相交的区间
其中 可取至-∞, 可
取至+∞, 一般取5≤k≤16;
(3) 计算观测值频数 , 即 个样本观测值 , …, 中落入第i个区间( , ]中的个数 (i=1,2,…,k);
(4) 在 成立的条件下, 计算X 落入各区间
的概率 ,
进而得到理论频数 (i =1, 2, …, k);
(5) 将 , 代入(8.4.4) 求出 的值;
(6) 查 分布表得 ;
(7) 作出推断结论: 若 ,
则拒绝 , 否则可接受 .
应注意的是, 利用 检验法时一般要求
≥5(i=1,2,…,k), 否则应适当地将相邻的
区间合并, 以满足此要求.
例8.4.1 检验6.2节例6.2.3中刀具寿命是否服从正态分布 取显著性水平 =0.05.
解 根据频率直方图的分布形状, 我们可
以推断总体“可能服从正态分布”.
8.4.4 方法应用
以随机变量X 表示刀具寿命, 需要检验
原假设
待检验正态总体中的两个参数μ与 都
是未知的, 我们先用最大似然法求其估计值:
将例6.2.3中的样本观测值代入上述公式, 计算得到
所以,现在需要检验假设
将实数轴分为10个区间 , 第一个区间是
(-∞, 339.5], 最后一个区间为(363.5, +∞) ,
其它各区间保持不变 .
下面计算落入各区间的概率.
i=1,2,…,10.
类似地, 计算可得的 值.
结果见表8-1.
通用公式:
具体计算各区间概率,得到:
表8-1 例8.4.1频率,概率与统计量值
组号 区间 ni pi npi (ni-npi)2/npi
1
2 (-∞, 339.5]
(339.5, 342.5] 0.0183
0.046 0.0288
3 (342.5, 345.5] 11 0.1093 10.93 0.0004
4 (345.5, 348.5] 18 0.1858 18.58 0.0181
5 (348.5, 351.5] 24 0.2277 22.77 0.0664
6 (351.5, 354.5] 20 0.1981 19.81 0.0018
7 (354.5, 357.5] 12 0.1295 12.95 0.0697
8
9
10 (357.5, 360.5]
(360.5, 363.5]
(363.5,+∞] 0.0597
0.0197
0.0059 0.0259
合计 100 0.2111
所以,接受 , 即认为刀具寿命服从正态分布
N(350.38, 5.22).
合并后区间个数 k =7, 这里有两个
待估参数, 故 r =2. 对于α=0.05, 查表得
因为
讲评
(1) 要解决的问题是“刀具寿命是否服从正态分布 ”,提示我们应该进行总体分布类型的假设检验,人们常用“总体分布的假设检验法”. (2) 施行“总体分布的假设检验法”的 步骤,提示读者分解划分, 注意处理npi≥5和5≤k≤16.
(3) 在理论上得到了可以接受的 结论“认为刀具寿命服从正态分布 N(350.38, 5.22)”, 我们就知道了正态总体的均值为350.38, 其方差为5.22. 当然,也可以再对其进行假设检验,计算有关的估计可信度、估计的误差精度等问题.
(4) 由于接受了结论 “认为刀具寿命 服从正态分布N(350.38, 5.22)” , 我们完全 可以进一步分析、讨论和预测该正态总体的概率问题. 例如进一步结合第七章的区间估 计, 结合第八章的假设检验, 结合第九章的线性回归分析等知识进行数据统计分析.
8.4.5 内容小结
(1) 关于总体分布类型或者分布表达式 的确定, 常用χ2检验法; (2) χ2检验法与直方图结合使用; (3) F0(x)中可以含有待定参数, 用最大 似然法求得; (4) 注意处理npi≥5和5≤k≤16.
卡尔·皮尔逊(Karl Pearson, 1857~1936), 英国数学家、哲学家, 现代统计学的创始人之一, 被尊称为统计学之父. 许多熟悉的统计名词如标准差, 成分分析,卡方检验都是他提出的.

展开更多......

收起↑

资源预览