Ch6-2统计量、经验分布函数与直方图 课件(共32张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源下载
  1. 二一教育资源

Ch6-2统计量、经验分布函数与直方图 课件(共32张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源简介

(共32张PPT)
第六章 数理统计的基本概念
6.2 统计量、经验分布函数与直方图
第六章 数理统计的基本概念
内容摘要: 在本节中, 提出了统计量这一常用概念, 研究了经验分布函数与总体理论分布的关系, 引入了直观的直方图方法,用来分析数据分布规律.
6.2 统计量、经验分布函数与直方图
6.2.1 提出问题
(2) 经验分布函数与总体理论分布的关系是怎样的
(1) 通过样本构造哪些实用的统计量?
6.2.2 预备知识
(2) 简单随机样本: 独立, 同分布.
(1) 总体与样本.
(3) 怎样直观地观察数据的分布态势呢?
6.2.3 建立理论
1. 统计量
样本是统计推断的依据, 在应用时, 往往不是直接使用样本, 而是对不同的问题构造一个合适的依赖于样本的函数——统计量, 利用这些样本的函数进行统计推断.

是相应于上述样本的样本值,
的观察值.
则称 是

的函数,
是统计量.
中不含未知参数. 则称

显然, 统计量是一个随机变量, 它不含
任何未知参数.
样本,

是来自总体X的一组
定义1
例6.2.1 设X1, X2, X3是取自正态总体X~N( , 2)的一组样本, 其中 已知, 未知, 问样本函数X1+X3, X2-1, max{ X1, X2, X3} ,
中, 哪些是统计量, 哪些不是统计量?
前四个样本函数都不含未知参数, 所以均是统计量. 而最后一个样本函数含有未知参数 , 所以它不是统计量.

定义2 设 是来自总体X的一组样本, 是这一样本的观察值.
样本k阶中心矩 .
几个常用的统计量:
样本方差 ;
样本标准差 ;
样本k阶(原点)矩 ;
样本均值
可见, 1阶原点矩A1就是样本均值 , 2阶
中心矩B2不是样本方差S2.
样本均值观察值 ;
是上述样本的一组观察值,
上述统计量的观察值分别表示为:
样本方差观察值 ;
样本标准差观察值 ;
,
样本k阶(原点)矩观察值 ;
,
样本k阶中心矩观察值 .
讲评
(1) 上述统计量, 我们在以后学习中
会经常使用, 读者应该熟练掌握计算公式.
(2) 上述关于样本中的概念要和总体的相应概念联系并对比学习,这样,才能理解透彻,掌握它们之间的关系,见下述定理1.
关于样本均值与样本方差的性质有
如下常用定理.
定理1 设 是来自总体X的容量为n的样本, 若总体X(不论X服从什么分布)有期望 和方差 , 则
(1)
(2)
(3)
(5) 若总体X的k阶矩E(Xk)存在且记为μk, 则当n→∞时
(4)
(6)若g为连续函数, 则
证 我们只证明结论(4)与(5)及(6), 其它
结论请读者自证.
因为 是来自总体X的容量为n的样本, 根据3.3节定理3得到 也是独立同分布随机变量, 且
由独立同分布大数定律得
所以, 我们又得到
又因为 , 由5.1节定理2得到 , 所以
定理1的结论(4)成立.
根据辛钦大数定律知
因为 独立且与X同分布, 根据3.3节定理3得到 独立且与Xk同分布, 故有
讲评 (1) 定理1揭示了样本中的概念和总体的相应概念的联系;
(2) 定理1是下一章介绍的矩法估计的理论基础,提示读者深刻理解.
所以, 定理1的结论(5)成立.
由依概率收敛序列的性质(5.1节 定理2)知结论(6)成立.
例如,
2. 经验分布函数
我们还可以做出与总体分布函数
F(x)相应的统计量——经验分布函数.
定义3 设 是总体X的一组容量为n的样本观察值.对于任意的实数x∈(-∞,+∞),以sn(x)表示样本的n个观察值中不大于x的观察值的个数. 记
则Fn(x)叫做总体X的经验分布函数.
例6.2.2 设总体X具有一组样本值
1, 2, 2, 2, 4, 求X的经验分布函数.

所以, 的经验分布函数为
讲评
通过样本值我们可以得到“经验分布函数”,这在解决实际问题时是方便的, 而总体的真正的“分布函数”我们一般却不易求得.
思考题:二者的关系如何呢?怎样利用它们呢? 由下面的定理可以知道, 经验分布函数具有分布函数的性质.
Fn(x)以概率1一致收敛于分布函数F(x), 即
讲评 对于任一实数x, 当n充分大时, 经验分布函数Fn(x)与总体分布函数F(x)只有微小的差别, 从而可当作F(x)使用. 这在许多数据处理中常用.
定理2 对于任一实数x, 当

3. 直方图
在数理统计的实际应用中, 需要对
总体进行随机抽样并作出适当的估计. 上面学习的经验分布函数就是利用样本信息研究总体分布函数的一种常用方法. 另一方面, 当取得一组样本值后, 一般要先根据样本的取值规律对总体的分布情况作一个几何直观上的粗略的了解, 然后再进行下一步的推断分析. 这需要作出频率直方图.
(1) 找出n个数据中的最小值 及最大
值 , 即:
设对总体X作n次观测,得到n个数据
作直方图可分为以下几个步骤:
(2) 取区间(a, b],使a略小于 ,b略大于 ,
从中插入k-1个分点:
把区间(a, b]分成k个子区间:
为第i组组中值.各组组距可以相等, 也可以不等. 子区间的个数k一般可取8至15个,太多及太少均不易显示出分布特征. 另外, 分点数值应比数据的有效数字多一位.
称 为第i组组距,
(3) 计算数据落入各区间的频数ni及频率
就等于数据落入第i个小区间的频率, 即
(4) 在x轴截取各子区间,并以各子区间为底,

为高, 作出n个小矩形.每个小矩形的面积
, i=1,2,…,k.
于是有
这样就作成了频率直方图.
当样本容量n充分大时, 根据大数
定律,随机变量X落入子区间(ai-1, ai]内的频率近
似地等于其概率, 即有
因此, 直观上可以大致看出总体X的分布规律.
直方图的作用是,通过目测图形趋势,
我们可以猜想出总体的大致分布类型. 可能这个类型包含一些待定参数,但是从大体上提示了许多有用的信息,因此,在实际问题研究中,作直方图的方法也会经常地用到. 提示读者重视.
讲评
例6.2.3 一台数控车床连续用刀具加工某种零
件, 从换上新刀具到损坏为止加工的零件个数
称为刀具的寿命. 现记录100把刀具的寿命如下:
344 352 340 351 353 348 353 359 351 355
350 345 352 349 355 341 351 355 352 348
353 348 341 346 349 350 351 348 353 362
338 355 352 356 350 351 349 357 348 358
353 346 352 350 352 345 347 354 351 347
346 343 347 343 357 349 353 345 350 358
354 344 349 340 345 359 348 356 346 357
359 349 355 354 344 353 346 351 354 347
352 344 347 363 355 342 366 352 350 347
346 349 350 360 346 358 350 345 349 355
写出刀具寿命的频率分布并作出直方图.
解 这些样本观测值中最小值是338,
最大值是366, 故我们把数据的分布区间
定为(336.5, 366.5], 并把这个区间分成
10等分,各组
(336.5, 339.5],(339.5, 342.5],
…,(363.5, 366.5].
分别求出各组频数ni及频率 fi, 列出表6-1.
组距为3, 得10个小区间:
表6-1 例6.2.3数据分布频数与频率
组号 寿命区间 频数ni 频率fi
1 (336.5, 339.5] 1 0.01
2 (339.5, 342.5] 5 0.05
3 (342.5, 345.5] 11 0.11
4 (345.5, 348.5] 18 0.18
5 (348.5, 351.5] 24 0.24
6 (351.5, 354.5] 20 0.20
7 (354.5, 357.5] 12 0.12
8 (357.5, 360.5] 6 0.06
9 (360.5, 363.5] 2 0.02
10 (363.5, 366.5] 1 0.01
合计 100 1.00
图6-1 例6.2.3数据直方图
绘出直方图如图6-1所示.
(1) 从图6-1中可以看出, 直方图
呈现“两头低, 中间高”, 而且比较对称, 大致可以认为刀具寿命服从某个正态分布, 其数学期望大致在350附近.
(2) 在理论上是否可以推断“刀具寿命服从某个正态分布”,还需要进行总体分布的假设检验. 关于总体分布的假设检验见8.4节.
讲评
6.2.4 内容小结
(1) 通过样本构造哪些统计量?
(2) 经验分布函数与总体理论分布的关系
是什么
(2)
解决问题:
(1) 样本均值, 样本方差, 样本k阶原点矩和样本k阶中心矩.
(3) 怎样直观地观察数据的分布态势呢?
(3) 直方图观察、分析样本值的分布趋势.
思考题:样本值和样本有何联系?
样本是相互独立的与总体X 同分布的
n 维随机变量, 样本一旦抽出, 它们是n个具体的值, 称为样本值. 所以样本值是随机变量的一个可能取值, 两次抽取(每次取 n个)中得到的两组数据一般是不相同的.

展开更多......

收起↑

资源预览