5 抽样分布 课件(共69张PPT)-《概率论与数理统计(第三版)》同步教学(人民大学)

资源下载
  1. 二一教育资源

5 抽样分布 课件(共69张PPT)-《概率论与数理统计(第三版)》同步教学(人民大学)

资源简介

(共69张PPT)
音乐
抽样分布
第五章
1
从本章起,我们转入课程的第二部分—数理统计学。数理统计学与概率论是两个有密切联系的姐妹学科。大体上可以说,概率论是数理统计学的基础,而数理统计学是概率论的重要应用.
数理统计学是一门关于数据资料的收集、整理、分析和推断的科学。但人们常常将统计这一概念误解为大量数据的收集以及对这些数据作一些简单的运算(如求和、求平均值、求百分比等),或用图表、表格等形式把它们表示出来。其实这些工作仅仅是统计学工作的非主要部分,统计学还包括怎样设计试验、采集数据以及怎样对获得的数据进行分析、推断等其他许多工作。
2
数理统计的方法及考虑的问题不同于一般的资料条件,它更侧重于应用随机现象本身的规律性来考虑资料的收集、整理和分析,从而找出相应的随机变量的分布律或数字特征。从理论上讲,只要对随机现象进行足够多次的观察,被研究的随机现象的规律性一定能清楚地呈现出来,但实际上所允许的观察永远只能是有限次的,有时甚至是少量的,因此我们关心的问题是怎样有效地利用有限的资料,尽可能作出精确而可靠的结论。
根据问题的不同要求以及对观察值所采取的不同处理方法,就产生了数理统计的各个分支:参数估计、假设检验、方差分析、回归分析等。
3
§1 总体与样本
一、总体
在统计学中,我们将问题所涉及的研究对象的全体称为总体(或母体), 而把组成总体的每个研究对象称为个体。
例如,在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每只灯泡就是个体。
研究某批灯泡的质量
总体
个体
4
但是在统计学里,我们关心的不是个体的种种具体特征,而仅仅是它的某一项(或某几项)数量指标 X 以及X 的分布情况. 例如上述例子中的灯泡的寿命。
由于个体的抽取是随机的, 所以总体 X 是一个随机变量, 我们要研究的就是 X 的分布或数字特征. 以后我们把总体和数量指标 X 等同起来.
类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用 X 和 Y 分别表示身高和体重,那么此总体就可用二维随机变量 (X,Y) 或其联合分布函数 F(x, y) 来表示.
5
再举一个例子。设有一物体,它的重量未知,要通过多次测量去估计它。那么在这个问题中总体是什么呢?
有人可能回答,与研究的问题有关的对象就这个物体,故这个物体,或其重量,就构成总体。这个回答不对。
实际上,每一次测量所得结果是一个个体,而总体是由“一切可能的测量值”组成。这只是一个想象中存在的集合,因为不可能去进行无限次测量。它的个体是通过试验“制造”出来的。
这种情况在实际应用中非常之多。给这种总体同样可规定分布,例如上述例子中说“测量结果服从正态分布”是容易理解的。
6
二、样本
一般情况下,对总体的每一个个体都进行观察或试验是不可能的,这是因为经济上、时间上不允许(如个体的数量很大),或观察试验是带破坏性的(如灯泡的寿命、炮弹的射程).因此,必须对总体进行抽样观察.
由于我们是利用抽样来对总体的分布进行推断,所以抽样必须是随机的. 比如,要研究一大批灯泡的寿命,抽样时就希望每个灯泡等可能地被抽到,只有这样才能通过抽样比较客观地了解总体.
7
2. 独立性: X1,X2,…,Xn是相互独立的随机变量。
由于抽样的目的是为了对总体的分布进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.
最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:
1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有相同的分布.
由简单随机抽样得到的样本称为简单随机样本,
今后如不加声明,均指简单随机样本。
8
事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.
总体、样本、样本值的关系
9
统计是从手中已有的资料—样本值,去推断总体的情况—总体分布F(x)的性质.
总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.
样本是联系二者的桥梁
总体(理论分布)

样本
样本值
10
§2 统计量
样本是总体的代表和反映,但我们在抽取样本后,并不直接利用样本进行推断,而需要对样本进行一番“加工”和“提炼”,把样本中所包含的关于我们所关心的事物的信息集中起来,这便是针对不同的问题构造样本的某个函数,称之为样本函数。
实际上,统计量也是一个随机变量。
如果一个样本函数中不包含总体的任何未知参数,则称之为统计量。
下面列出一些常用的统计量,多是样本的数字特征。
11
1、样本均值
2、样本方差
它反映了总体均值的信息
它反映了总体方差的信息
3、样本标准差
它反映了总体标准差的信息
12
4、样本 k 阶原点矩
反映总体 k 阶原点矩
的信息
5、样本 k 阶中心矩
反映总体 k 阶中心矩
的信息
一阶原点矩就是样本均值 。
13
证:
证明:
14
定理

所以

15

16
§3 抽样分布
统计量的分布,称为抽样分布。如何在总体的分布已知时,求出统计量的分布函数, 这对于数理统计学中的所谓小样本问题(即在样本容量较小的情况下所讨论的各种统计问题)的研究很有用处.
17
一、几个常用的分布
分布
1、
定义
记为
其密度函数为
18
来定义.
其中伽玛函数 (x) 通过积分
19
(1) 可加性:
可推广到多个变量;
(2)
应用中心极限定理可得,
则当 n 充分大时,有

20
设 相互独立, 都服从正态分布

(3)

且相互独立,
所以
21
2、t 分布
t (n)的密度函数为:
记为 T ~ t (n) .
定义
独立,则称随机变量
服从自由度为n的t 分布,
22
偶函数, 关于 x = 0 对称.
当n 较大时,t 分布接近于标准正态分布.
23



所服从的分布。

24
由 t 分布的定义知,
即统计量 V 服从自由度为 9 的 t 分布。
25


且它们相互独立,
由 t 分布的定义,
26
3、F 分布
定义
独立,则称随机变量
F(n1, n2) 的概率密度为
服从自由度为 的 F 分布,
记为
27
28


29


且两者相互独立,所以
30
二、分位点
1、标准正态分布的分位点:
查表,
31


设车门高度为h cm时,男子与车门碰头的概率为0.01,则
因此要使男子与车门碰头的概率不超过0.01,车门高度至少为184 cm。
32
2、 分布的分位点:
查表,
33
当n充分大时,近似地有
例如,
精确,
34
3、t 分布的分位点:
查表,
当n充分大时,
35
4、F 分布的分位点:
查表,
36
例如,
37
三、正态总体的抽样分布
统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布” .
统计量是我们对总体的分布或数字特征进行推断的基础,因此,研究统计量的分布是数理统计的基本问题之一。一般来说,要确定一个统计量的精确分布是非常复杂的,可是对正态总体而言,这个问题往往有较简单的解法。下面主要研究正态总体的统计量的分布。
38
由正态分布的可加性,而前已证明
定理1

所以
标准化
39
定理2
证略.
比较:
40
定理3

由定理1,
由定理2,
41
由 t 分布的定义,
42
下面讨论一下两个正态总体的情况.
43
定理4
(1)
(2)
其中
称为联合样本方差。
加权平均
44
(3)
定理4
45

由定理1,
(1)
由正态分布的可加性,可得
标准化,即得
46
由定理2,
(2)
则有
47
且 U 与 V 相互独立,则
48
其中
49
由 F 分布的定义,
由定理 2,
(3)
50


所以
51
小结
样本均值
样本方差
设总体的期望和方差分别为
则有
52
三大抽样分布:
(1)
(2)
(3)
53
抽样分布定理:
(1)
(2)
(3)
54
(4)
55
(5)
56
练习:
P120 习题五
3.
57
END
END
58
补充题:
1.
2.
59
1.
补充题解答:


60
由F分布的定义知,

61
2.



标准化得
62
又由抽样分布定理知
于是据 t 分布的定义得

63
习题选解
(A)
64
由已知得

所以
于是
65
习题选解
(B)
66
67

由 t 分布的定义知,
所以应选 B。
68

以及标准正态分布密度曲线的对称性可得
【答案】应选(C).
69

展开更多......

收起↑

资源预览