第4章抽样分布 课件(共28张PPT)-《统计学-理论、案例、实训》同步教学(电工版)

资源下载
  1. 二一教育资源

第4章抽样分布 课件(共28张PPT)-《统计学-理论、案例、实训》同步教学(电工版)

资源简介

(共28张PPT)
第4章 抽样分布
第一节 总体与样本
第二节 抽样方法
第三节 抽样分布
学习目标
了解总体与样本的概念
理解常用的抽样方法
理解抽样分布的意义
了解抽样分布的形成过程
第一节 总体与样本
一、总体与样本
二、参数与统计量
总体和样本
(population and sample)
总体(population)
所研究的全部个体(数据) 的集合,其中的每一个元素称为个体
总体中所包含的元素数量多少称为总体容量,用N表示
分为有限总体和无限总体
有限总体的范围能够明确确定,且元素的数目是有限的
无限总体所包括的元素是无限的,不可数的
样本 (sample)
从总体中抽取的一部分元素的集合
构成样本的元素数目称为样本容量,用n表示
n>30的样本称为大样本,n 30的样本称为小样本







参数与统计量
(parameter and statistic)
参数(parameter)
描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值
所关心的参数主要有总体均值( )、标准差( )、总体比例( )等
总体参数通常用希腊字母表示
统计量(statistic)
用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数
所关心的样本统计量有样本均值( x)、样本标准差(s)、样本比例(p)等
样本统计量通常用小写英文字母表示
第二节 抽样方法
概率抽样
(probability sampling)
根据一个已知的概率来抽取样本单位,也称随机抽样
特点
按一定的概率以随机原则抽取样本
抽取样本时使每个单位都有一定的机会被抽中
每个单位被抽中的概率是已知的,或是可以计算出来的
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率
简单随机抽样
(simple random sampling)
从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量样本都有相同的机会(概率)被抽中
抽取元素的具体方法有重复抽样和不重复抽样
特点
简单、直观,在抽样框完整时,可直接从中抽取样本
用样本统计量对目标量进行估计比较方便
局限性
当N很大时,不易构造抽样框
抽出的单位很分散,给实施调查增加了困难
没有利用其他辅助信息以提高估计的效率
分层抽样
(stratified sampling)
将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本
优点
保证样本的结构与总体的结构比较相近,从而提高估计的精度
组织实施调查方便
既可以对总体参数进行估计,也可以对各层的目标量进行估计
机械抽样
(systematic sampling)
将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位
先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位
优点:操作简便,可提高估计的精度
缺点:对估计量方差的估计比较困难
整群抽样
(cluster sampling)
将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查
特点
抽样时只需群的抽样框,可简化工作量
调查的地点相对集中,节省调查费用,方便调查的实施
缺点是估计的精度较差
第三节 抽样分布
一、抽样分布的定义
二、常用统计量的分布
样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
随机变量是 样本统计量
样本均值, 样本比例,样本方差等
结果来自容量相同的所有可能样本
提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据
抽样分布
(sampling distribution)
2 分布
t 分布
F 分布
样本均值的分布
样本方差的分布
样本比率的分布
两个样本统计量的分布
常用统计量的分布
由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年和1900年推导出来
设 是来自总体 的样本,则称随机变量
服从自由度为n的 2分布,记为
c2-分布
( 2-distribution)
分布的变量值始终为正
分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称
期望为:E( 2)=n,方差为:D( 2)=2n(n为自由度)
可加性:若U和V为两个独立的 2分布随机变量,U~ 2(n1),V~ 2(n2),则U+V这一随机变量服从自由度为n1+n2的 2分布
c2-分布
(性质和特点)
不同自由度的c2-分布
c 2
n=1
n=4
n=10
n=20
t-分布
(t-distribution)
提出者是William Gosset,也被称为学生分布(student’s t)
t 分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布
x
t 分布与标准正态分布的比较
t 分布
标准正态分布
t
不同自由度的t分布
标准正态分布
t (df = 13)
t (df = 5)
z
为纪念统计学家费希尔(R.A.Fisher) 以其姓氏的第一个字母来命名
设若U为服从自由度为n1的 2分布,即U~ 2(n1),V为服从自由度为n2的 2分布,即V~ 2(n2),且U和V相互独立,则
称F为服从自由度n1和n2的F分布,记为
F-分布
(F distribution)
不同自由度的F分布
F
(1,10)
(5,10)
(10,10)
在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布
一种理论概率分布
推断总体均值 的理论基础
样本均值的分布
样本均值的分布
与中心极限定理
= 50
=10
X
总体分布
n = 4
抽样分布
x
n =16
当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值 x也服从正态分布, x 的期望值为μ,方差为σ2/n。即 x~N(μ,σ2/n)
中心极限定理
(central limit theorem)
当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布
从均值为 ,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分布的总体
x
总体(或样本)中具有某种属性的单位与全部单位总数之比
不同性别的人与全部人数之比
合格品(或不合格品) 与全部产品总数之比
总体比例可表示为
样本比例可表示为
样本比例的分布
(proportion)
在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布
一种理论概率分布
当样本容量很大时,样本比例的抽样分布可用正态分布近似,即
样本比例的分布
样本方差的分布
在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布
对于来自正态总体的简单随机样本,则比值
的抽样分布服从自由度为 (n -1) 的 2分布,即
从两个总体中独立地抽取容量为的样本,当两个总体均为正态分布或均为大样本时,两个样本均值之差的抽样分布也为正态分布。即有:
两个样本方差比的抽样分布:
两个样本比率之差的分布:
两个样本统计量的抽样分布
本章小结
了解概率抽样方法
理解抽样分布的意义
了解抽样分布的形成过程
理解中心极限定理
理解抽样分布的性质

展开更多......

收起↑

资源预览