第3章 抽样分布 课件(共38张PPT)-《应用统计学(第4版)》同步教学(高教版)

资源下载
  1. 二一教育资源

第3章 抽样分布 课件(共38张PPT)-《应用统计学(第4版)》同步教学(高教版)

资源简介

(共38张PPT)
第三章 抽样分布
第一节 随机样本
第二节 抽样分布
本章小节
主要内容
第一节 随机样本
在统计学中,我们研究的问题一般集中在研究对象的某一数量指标。 比如某型号的电子元器件的寿命、一批某种产品的合格率等。因而,需要考虑通过与这一数量指标相联系的随机试验,来对这一数量指标进行试验或观测。
我们将试验的全部可能的观测值称为总体,每一个观测值称为个体,总体中所包含的个体数称为总体的容量。容量为有限的称为有限总体,否则称为无限总体。
3.1 关于抽样的基本概念
为什么要抽样
为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。


原因
元素多,搜集数据费
时、费用大,不及时而
使所得的数据无意义
总体庞大,难以对总体的全部元素进行研究
检查具有破坏性
炮弹、灯管、砖等
第一节 随机样本
简单随机抽样(x1, x2,……, xn):
简单随机抽样是指从总体中抽取样本容量为n 的样本时,x1, x2,……, xn这n个随机变量必须具备以下两个条件:
这n个随机变量与总体X具有相同的概率分布;
它们之间相互独立。
第一节 随机样本
甲乙丙丁四个生产商,其产品质量如下表所示:
如果仅从AB两个生产商的产品中进行抽样,抽样质量就偏高;如果仅从CD两个生产商的产品中进行抽样,抽样质量就偏低;
因此采用简单随机抽样保证随机样本与总体具有相同的概率分布。
A B C D
质量 高 高 低 低
样本统计量与抽样分布:
在简单随机抽样中,样本具有随机性,样本的参数 ,s2等也会随着样本不同而不同,故它们是样本的函数,记为g(x1, x2,……, xn),称为样本统计量。
统计量的概率分布称为抽样分布(Sample
distribution)
3.1 关于抽样的基本概念
第一节 随机样本
3.1 关于抽样的基本概念
第二节 抽样分布
一、 统计量
定义
不含有任何未知参数的样本的函数,称为统计量 。显然,统计量为随机变量。
几个常用统计量
样本矩(样本均值;样本方差;原点矩,中心矩等)
几个常用统计量
二、几个常用的抽样分布
抽样分布的定义
统计量的分布称为抽样分布。
来自正态总体的几个常用统计量的分布,已有一些重要的结果(人们已经获得这些统计量的具体的分布密度函数)。下面介绍来自正态总体的几个常用统计量的分布。
第二节 抽样分布






正态分布
分布
F分布
t分布
几种与正态分布有关的概率分布
若随机变量X的概率密度函数
则称X为服从正态分布的随机变量,记为
1. 正态分布
图4-1
一般正态分布
1. 正态分布
标准正态分布:
当 时,
记为U∽N(0,1)
图3-1
标准正态分布
1. 正态分布
非标准正态分布向标准正态分布的转化

标准化公式
则U∽N(0,1)
1. 正态分布
查表
当u大于零时,可查正态分布表
但如果u<0时,则可由式φ(-u)=1-φ(u)求出
1. 正态分布
线性性质:
如果 , 且相互独立。对于常数 ,有下式成立:
1. 正态分布
2. 分布
设 是来自总体 的样本,则称统计量
为服从自由度为 的 分布,记为
的一个重要性质:可加性
图3-2
χ2分布图
2. 分布
查表:
对于给定的α,0<α<1,可在 分布表中查得,即
例如
即指
2. 分布
设 , ,且设 与 独立,则称统计量
为服从自由度为 的 分布,记为 。
可以证明,当 充分大时, 分布趋向于标准正态分布。
3. 分布
图3-3
n=∞正态分布
n=10
n=1
t分布图
3. t分布(Students 分布)
查表

性质:
当n很大时,
此时,tα/2≈uα/2,t分布近似标准正态分布。
3. t分布(Students 分布)
4. 分布
设 ,且设 独立,则称随机变量
为服从自由度为 的分布,记为
分布的上 分位点满足下列关系:
图3-4
F分布图
F
4. F 分布
有限总体
有限总体若采取有放回抽样,则与无限总体等价。有限总体容量为N而采取无放回抽样,且n/N≤0.1,仍可视为无限总体,而当n/N>0.1时则
称式 为有限总体的修正系数 。
4.3 样本平均数的抽样分布
5. 基于正态总体样本的均值与方差的分布
从总体中抽取样本容量为n的简单随机样本,当样本容量 n ≥ 30时,样本均值 的抽样分布可用正态概率分布近似。
中心极限定理
5. 基于正态总体样本的均值与方差的分布
(四)基于正态总体样本的均值与方差的分布
设 来自正态总体 的样本,
分别为样本的均值和方差。则
设 为来自正态总体 的样本,
为来自正态总体 的样本 ,
分别为两个样本的均值和方差。则
当 时,则
三、 样本比例的抽样分布
(一)重复抽样下样本比例的抽样分布
可以证明,
(二)不重复抽样下样本比例的抽样分布
可以证明,
本章小结
统计量是统计推断的基本变量。统计量是不含有任何未知参数的样本的函数。
统计量的分布称为抽样分布。
对于正态总体,我们给出了几个常用的统计量的分布。
对于实际应用中的比率问题,给出了大样本下的抽样分布。
思考题
思考题
思考题
案例讨论题
在1936年的美国总统选举中有两位候选人,即民主党候选人罗斯福(F.D.Roosevelt)和共和党候选人兰登(G.A.London)。 有一家文摘杂志通过从电话号码簿和一些俱乐部成员的名单中选取1000万人,以发出询问信的方式进行民意调查,共有240万人作出了回答。据此资料,此文摘杂志预测兰登将以获得57%的选票获胜,而罗斯福的得票率将是43%。而选举结果罗斯福的得票率则是62%,兰登仅得到38%的选票。 为此,这家杂志社很快就倒闭了。
自1916年以来,此家杂志每次所作的预测都是正确的,因而影响很大。 这次它的预测基于巨大数字的240万的答卷作出的,却预测错误。
当时有电话的家庭有1100万户,失业者有900万人。
有一个叫乔治.盖洛普(George Gallup)的人建立的一个调查组织从1000万人中随机选取了3000人,就提前知道了文摘将要得出的结论:兰登将以56%的选票获胜,这与文摘公布结果的仅差1%,而这个结论来自于3000人而非204万人。 盖洛普从更大的范围内随机选取了5000人,据此预测罗斯福将以56%得票率获胜,而兰登的得票率为44%。 与实际结果差6%。
讨论题:
(1)此文摘杂志社此次预测错误的根本原因?
(2)为什么盖洛普预测成功?
(3)预测的误差是否随着抽样数量的增加而减少?
(4)从这个案例分析中得到什么启发?

展开更多......

收起↑

资源预览