6 参数估计 课件(共94张PPT)-《概率论与数理统计(第三版)》同步教学(人民大学)

资源下载
  1. 二一教育资源

6 参数估计 课件(共94张PPT)-《概率论与数理统计(第三版)》同步教学(人民大学)

资源简介

(共94张PPT)
第6章
参数估计
1
在数理统计的许多问题中,总体的分布类型往往假定是已知的,例如,大批灯泡的寿命服从正态分布,纺织厂细纱机上的断头次数服从普阿松分布,抽检若干件产品中所含的次品数服从二项分布,等等。但仅仅知道分布的类型是不够的,还需确定分布函数中的未知参数,才能求得所要求的概率。这就提出了参数估计的问题。
参数估计分为点估计和区间估计两种。
2
§1 点估计
3
一、矩法(The Method of Moments)
其基本思想是用样本矩估计总体矩 .
它是基于一种简单的“替换”思想建立起来的一种估计方法 .
是英国统计学家 K.皮尔逊最早提出的 .
矩法估计的理论基础是:辛钦大数定律.
4
记总体 k 阶矩为
样本 k 阶矩为
用相应的样本矩去估计总体矩的估计方法就称为矩估计法。
记总体 k 阶中心矩为
样本 k 阶中心矩为
5
比较:
样本方差
6



所以θ的矩估计量为
7


8


9
二、最大似然估计法
最大似然法,也叫极大似然法,它最早是由高斯所提出的,后来由英国统计学家费歇(R·A·Fisher)于1912年在其一篇文章中重新提出,并且证明了这个方法的一些性质.最大似然估计这一名称也是费歇给的.它是建立在最大似然原理的基础上的一个统计方法.为了对最大似然原理有一个直观的认识,我们先来看几个例子.
(The Method of Maximum Likelihood)
10
最大似然法的基本思想
先看一个简单例子:
一只野兔从前方窜过。
是谁打中的呢?
某位同学与一位猎人一起外出打猎。
如果要你推测,
你会如何想呢
只听一声枪响,野兔应声倒下。
11
下面我们再看一个例子,进一步体会最大似然法的基本思想 .
你就会想,只发一枪便打中,猎人命中的概率一般大于这位同学命中的概率。看来这一枪是猎人射中的 .
这个例子所作的推断已经体现了最大似然法的基本思想。
12
设有外形完全相同的两个箱子,甲箱有99个白球1个黑球,乙箱有1个白球99个黑球。今随机地抽取一箱,然后再从这箱中任取一球,结果发现是白球。问这球是从哪一个箱子中取出的
分析 导致结果是白球的原因有两个,一个是这球从甲箱取的,另一个就是这球从乙箱取的。如果是从甲箱取的,则取得白球的概率为99%;如果是从乙箱取的,则取得白球的概率为1%,由此看到,这球是从甲箱中取出的概率比从乙箱中取出的概率要大得多,因此很自然的,我们认为结论“这球是从甲箱中取出的”比结论“这球是从乙箱中取出的”要合理得多。最后我们作出推断,这球是从甲箱取出的。
13
最大似然估计法的基本思想:根据样本值来选择参数,使该样本发生的概率最大。具体做法如下:
为“似然函数”。
14
求最大似然估计(MLE)的一般步骤是:
取对数,
求得驻点,
即得θ的最大似然估计量。
15



16

解得
17

例 设一批产品中含有次品,从中随机抽取85件,发现次品10件,试用最大似然估计法估计这批产品的次品率。
似然函数为
18

似然函数为
解得 p 的最大似然估计值为
19

例 设总体 X 服从指数分布,其密度函数为
(1)
(2)
20
(2)

21

例 设总体 X 的概率密度为
总体 X 的数学期望为
得θ的矩估计量为
22
似然函数为
23
解得θ的最大似然估计量为
比较:
θ的矩估计量为
24


的密度函数为
似然函数为
25
比较:
θ的矩法估计量为
26
由上例,我们看到对于同一个未知参数,由不同的方法可以得到不同的估计量。
在本例中,如果X表示乘客的候车时间,随机抽样得到的5位乘客的候车时间为 0.5, 1, 2, 3.5, 8,则其矩估计值为6,而其最大似然估计值为 8。
27


下面再举两个离散型总体的例子。
概率函数为
似然函数为
28
解得 p 的最大似然估计量为
29
例如,设一批产品中含有次品,且从中随机抽取85件,发现次品10件,则这批产品的次品率的最大似然估计值为
30

X 服从几何分布,
所以 p 的矩估计量为
例 设总体 X 的概率密度为
(1) 矩估计法:
31
解得 p 的最大似然估计量为

(2) 最大似然估计法:
32
练习:
P143 习题六
3. 5.
33
第二节
估计量的评价标准
34
对于同一个参数,用不同的方法可以得到不同的估计量。现在的问题是,当同一参数出现多个估计量时,究竟哪一个更好呢?这就涉及到用什么标准来评价估计量的问题。
确定估计量好坏的标准必须是整体性的,说得明确一点就是,必须在大量观察的基础上从统计的意义上来评价估计量的好坏。也就是说。估计的好坏取决于估计量的统计性质。一般认为,一个“好”的估计量应该具有如下的条件:
35
一、无偏性 (Unbiasedness)
估计量是随机变量,对于不同的样本值就会得到不同的估计值,希望估计值在未知参数真值左右波动,最好它的数学期望等于未知参数的真值,这就导致了无偏性这个标准。
定义
36
样本方差
37

所以

38
39




40

由正态分布的性质以及样本的独立性可知
所以

41
二、有效性 (Efficiency)
一般来说,一个参数往往有多个无偏估计量。
若 有两个无偏估计量:
, 则
当a+b=1时也是 的无偏估计量。
估计量的无偏性只保证了估计量的取值在参数真值周围波动,但是波动的幅度有多大呢?自然地,我们希望估计量波动的幅度越小越好,幅度越小,则估计量取值与参数真值有较大偏差的可能性越小,而衡量随机变量波动幅度的量就是方差。这样就有了我们下面要介绍的有效性的概念。
42
定义
43


44

45
例4

46

47
可以证明,若
则当
时,
达到最小。
48

例5
49
用拉格朗日乘数法,
50
定理
此定理说明,增加样本容量可提高估计量的有效性。
51
三、一致性 (Consistency)
定义
时,
即当
依概率收敛于
直观上看,当 n 增大时,样本信息增多,当然希望估计量越来越靠近真值的概率也越来越大,这种想法就引出了上面的一致性概念。一致估计量一般当样本容量很大时,才能显示其优点。
52
由辛钦大数定理可以证明,
是 DX 的相合估计量。
53
练习:
P143 习题六
6.
(B) 3.
54
§3 区间估计
假如 是未知参数 的一个点估计,那么一旦获得样本值 ,估计值 就给出了一个确定的数,这个数给我们一个关于该参数的明确的数量概念.但是,我们必须注意到,点估计值只是 的一个近似值,它本身并没有反映这种近似值的精度,也就是说它并没有给出近似值的误差范围.
更进一步的,在数理统计学中仅仅知道误差范围
也是不够的,由于样本的随机性,这个误差范围是一个随机区间,于是就连它是否包含 的真值都成了疑问.因此,我们还必须建立一种统计推断的方法,希望通过它能确定这个区间包含 真值的概率.
55
为了弥补点估计的不足,本节讨论区间估计的概念。区间估计是一种重要的统计推断方法,它是由奈曼(J.Neyman)在1934年开始的一系列工作中引入的,这种思想从确立之日起就引起了众多统计学家的重视。
点估计是用一个点(即一个数)去估计未知参数,而区间估计,就是用一个区间去估计未知参数。
56
则称区间 为 的
置信水平为
的置信区间.
定义
确定两个统计量
57
置信区间的含义:固定样本容量n,然后进行多次抽样,每次抽样得到一个区间, 由大数定律,当抽样的次数足够多时,包含 的真值的区间大约占 . 即我们能以概率 的可信程度保证,由样本值代入
中所得的区间包含 的真值.
根据给定的置信水平,确定未知参数θ的置信区间,称为参数θ的区间估计。
58
寻找未知参数θ的置信区间的基本步骤:
(1) 选取一个样本的函数
(2) 对于给定的置信度 1-α , 定出常数 a, b,使得
一般利用
所服从分布的分位点
它只含待估参数θ,而不含其它未知参数,它的分布已知且不依赖于任何未知参数(当然也不包含参数θ本身);
来确定;
(3) 利用不等式变形, 求得未知参数θ的置信区间,若
则区间
即为所求置信区间.
59
§4 正态总体均值与方差的区间估计
一、单个正态总体 的情形
1. 已知时 的区间估计
此时选取样本的函数为
对给定的置信水平
按标准正态分布的上 分位点的定义,
查正态分布表得
60
1. 已知时 的置信区间
于是所求 的置信区间为
有时简记为
61


62
例1

63

例2 对50名大学生的午餐费进行调查,得样本均值为10.10元,假如总体的标准差为1.75元,求大学生的午餐费 的0.95的置信区间。
64

例3
置信区间的长度是0.82, 比较短.
65
注:
66
2. 未知时 的置信区间
上一章已证得
67

有时简记为
68


69
例4

70
3. 未知时 的置信区间
考虑随机变量
71
其中
72


73
例5

74
二、两个正态总体

的情形
下面介绍两个正态总体均值差和方差比的区间估计。
1. 与 已知时 的置信区间
由上一章知,
75
1. 与 已知时 的置信区间
由上一章知,
76


77
2. 未知时 的置信区间
由上一章知,
其中
78


79

80
例6 某工厂一条生产灯泡的流水线,在工艺改变前后分别抽检若干件产品的寿命,得数据为

改变前:
改变后:
假定灯泡寿命服从正态分布, 且工艺改变前后方差不变, 试求工艺改变前后平均寿命之差的95%的置信区间.
81
82
例7 某大学从A、B两市招收新生中分别抽5名、6名男生,测得身高

所求置信区间为
83
3. 两个总体方差比 的置信区间
由上一章知,


84


85


86

87
例8

88
例9 某大学从A、B两市招收新生中分别抽5名、6名男生,测得身高

所求置信区间为
89
例10 用两种工艺(或原料)A和B生产同一种橡胶制品.为比较两种工艺下产品的耐磨性,从两种工艺的产品中各随意抽取了若干件,测得如下数据:
工艺A:185.82, 175.10, 217.30, 213.86, 198.40
工艺B:152.10, 139.89, 121.50, 129.96, 154.82, 165.60
假设两种工艺下产品的耐磨性X和Y都服从正态分布:

经计算,得
90
(1) 查表得
91
经计算,得
查表得
算得
92
练习:
P143 习题六
7.
93
END
END
94

展开更多......

收起↑

资源预览