7.2统计估计和推算 课件(共17张PPT)-《基础统计第六版》同步教学(高教版)

资源下载
  1. 二一教育资源

7.2统计估计和推算 课件(共17张PPT)-《基础统计第六版》同步教学(高教版)

资源简介

(共17张PPT)
第七章 抽样推断
《基础统计》
第二节 统计估计和推算
01
点估计方法
02
区间估计方法
03
总量指标的推算
第二节 统计估计和推算
统计估计
是指据样本的特征信息来对总体的分布函数、分布参数或数字特征等进行推测估算的过程,也叫统计推断。
统计估计
(按推断依据)
参数估计
非参数估计
指已知总体的分布模型,而对模型中的某些未知参数的估计,或由模型的有限个参数决定的估计等问题。
指在总体分布模型等信息未知,或不能用有限个参数来表示的情况下进行的统计估计问题。
统计估计
(按推断形式)
点估计
区间估计

第二节
一、点估计方法
点估计的主要依据
大数定律
样本统计量

点估计
是指用样本统计量(或称样本指标)代替总体指标的估计方法,也叫定值估计法。它是统计估计中最直接、最简单的非参数估计方法。
(一)统计量选择的优良标准
评价估计量
是否优良的标准
1. 无偏性
2. 一致性
3. 有效性
第二节
一、点估计方法
(一)统计量选择的优良标准
无偏性
如果样本某统计量的数学期望值等于其所估计的总体参数,即为无偏估计量。如样本平均数的数学期望就是总体平均数,样本均值就是总体均值的无偏估计量,仅无系统偏差且具有平均意义,并不保证单独一次估计中无随机误差。
一致性
有效性
若估计量随样本容量n的增大而越来越接近总体参数的真值时,则称该估计量是被估计参数的一致性估计量。 估计量的一致性是从极限意义上讲的, 它适用于大样本的情况。
有效性是指无偏性估计量中方差最小的估计量。它要求估计量与被估计参数之间的离差是较小的。 如样本平均数与中位数都是总体均值的无偏估计量,但在样本容量相同的条件下,样本平均数是更为有效的估计量。
第二节
一、点估计方法
(二)点估计量的确定
1. 总体平均数的估计量选择
2. 总体成数的估计量选择
成数是指具有某一标志的单位数在总体(或样本)中所占的比重。选择样本成数p为总体成数)P的估计量,可以把成数作为平均数的特例来证明。
3. 总体方差的估计量选择
在样本方差的计算公式中,采用总离差平方和除以自由度(n-1)的算法,是总体方差的无偏估计量,而采用样本容量n计算的方差则是有偏的。
根据样本数据可计算样本平均数、中位数、众数等,究竟选择哪一个统计量为总体平均数的估计量?数理统计证明:当总体平均数未知时,随机从该总体中抽取一个容量为n的样本,则样本平均数 是总体平均数 的一个无偏、有效和一致性的估计量。
第二节
二、区间估计方法
点估计方法
的缺陷
点估计量与总体的未知指标之间并不完全相等,必然存在一定的误差。问题是:不能确切知道误差的大小,估计精度的高低,以及估计的可信程度等信息。
区间估计方法考虑点估计方法的缺陷,以点估计量为依据,加上允许误差构成一个估计区间,形成具有一定可靠性保证程度的统计估计方法。
区间估计方法
的形成
第二节
二、区间估计方法
(一)概率关系式与置信区间
在现实统计活动中,由于采用大量调查存在许多困难,有时采用很小的样本(n<30),同时又不了解其他相关信息(如未知总体方差),但又需要对总体均值进行估计。根据均值分布定理2有:
上式说明样本平均数的所有可能结果,经标准化后落在区间[-tα/2,tα/2]之内的概率为1-α。用概率关系式表示为:
把握程度 1-α 的总体均值的置信区间为:

第二节
二、区间估计方法
(二)区间估计的步骤
1. 置信度约束下的区间估计
(1)首先明确置信度1-α,即明确估计的可靠性(或叫把握程度)。该程度最常用的概率水平有95%、95.45%、99.73%等。
(2)计算或查找临界值。根据置信度1-α,计算或查表确定区间估计的双侧临界值。由中心极限定理可知,大样本以正态分布为极限,因此大样本条件下正态分布的临界值±uα/2,小样本条件下的临界值为±tα/2。
(3)计算估计统计量、允许误差。对总体平均数进行估计时,要计算样本平均数 、平均数的估计标准差 、进而计算允许误差 ;
(4)计算置信区间的上、下限,确定置信区间。总体平均数在某置信度约束下的置信区间就是样本平均数±允许误差,即 。
第二节
二、区间估计方法
(二)区间估计的步骤(置信度约束下的区间估计举例)
例2 某制造厂的产品重量服从正态分布,现随机抽取一个样本,计算结果是 =65千克,标准差s=15。试以95%的置信度,分别以样本容量n=9和n=100两种情况估计总体平均重量的置信区间。
01
当样本容量n=9时,属于小样本
概率为95%的置信区间:
02
当样本容量n=100时,属于大样本
查标准正态概率双侧临界值表
概率为95%的置信区间:
第二节
二、区间估计方法
(二)区间估计的步骤
2. 允许误差约束下的区间估计
如果在区间估计中,先给定允许误差,也可以根据上述概率关系,推算出该置信区间的概率置信度,具体步骤如下:
(1)计算样本统计量;
(2)明确允许误差;
(3)根据样本统计量与允许误差的关系计算临界值;
(4)根据临界值确定置信水平。
在平均数估计的允许误差中,
可用右边的公式进行计算:

第二节
二、区间估计方法
(二)区间估计的步骤(允许误差约束下的区间估计举例)
例3 从全校近万名学生中随机抽查100名学生的身高,测得平均数为170厘米,标准差为3厘米,现以不超过0.6厘米的允许误差为限,计算全体学生平均身高区间值的置信水平。
第一,计算全体学生平均身高的区间值
第二,计算置信度的临界值
第三,查标准正态概率双侧临界值表
置信水平
第二节
三、总量指标的推算
(一)直接推算法
对总体的未知总量进行推算时,因样本规模与总体规模没有对应的相同特征,所以不能以样本的总量特征来推算总体的总量指标。只能用总体平均指标或成数(比重)的点估计或区间估计值进行推算。
当抽样调查的任务是推断统计总体的总量指标时,可以用样本平均数直接乘以该事物的总体单位数获得。
总体总量
指标估计值
样本平均数(或比重)
总 体
单位数
=
×
第二节
三、总量指标的推算
(一)直接推算法(举例)
例4 某县玉米播种面积为26 537亩,实割实测16亩的随机样本的平均亩产量为300千克,其标准差为6千克。现以95%的概率保证程度,推算总产量及每亩产量的估计区间。
第一,查t分布临界值表
第二,计算平均亩产量的允许误差
第三,估计平均亩产量的置信区间
第四,推算总产量的置信区间
★即总产量在7876314~8045886
千克之间
第二节
三、总量指标的推算
(二)修正系数法
应用对象
修正全面调查的数字。如对人口普查和牲畜年报等统计数字进行复查。
操作方法
从全面调查的总体中随机抽取一部分单位组成样本,进行实地调查;然后将实际抽样调查的结果与这些被调查单位全面调查所报的数据进行比较,求得修正系数,进而修订全面调查的相关数据。
修订后的指标值=全面调查登记数×修正系数
第二节
三、总量指标的推算
(二)修正系数法(举例)
例5 某次某地人口普查得到人口总数为1 286 546人,其中文盲率为3%,为了检查人口普查质量,随机抽取10个观察点组成一个样本进行调查,其结果是:样本的普查登记人口数为13 584人,文盲率为2.95%;而抽查人口数为13720人,文盲率为3.1%。现对该地区人口总量、文盲率及其误差范围进行推算和修订。
首先,计算人口总量和文盲率的修正系数
然后,修订人口总数和文盲率
谢 谢
同学们的聆听
7-02
统计估计和推算
讲授完毕

展开更多......

收起↑

资源预览