5章抽样推断课件(共76张PPT)- 《统计学概论》同步教学（高教版）

资源简介

(共76张PPT)
第五章抽样推断
学习目标
主要内容
本章小结
思考与练习
了解抽样推断的作用、重复简单随机抽样
的特点、不重复简单随机抽样的特点；
理解有关抽样分布的概念、假设检验意义
和程序；
掌握抽样推断的含义、抽样推断的几个基
本概念，掌握重复简单随机抽样方法、不
重复简单随机抽样方法，掌握点估计方
法、区间估计方法。
了解重复简单随机抽样与不重复简单随机抽样条件下抽样平均误差的推导过程；
知道如何进行假设检验；
会计算重复简单随机抽样的有关总体、样本指标，不重复简单随机抽样的有关总体样本指标，能根据有关资料进行点估计、区间估计，能进行必要抽样数目的计算。
第二节随机抽样方法与抽样分布
第一节抽样推断的基本概念
第三节参数估计
笫四节假设检验
第一节抽样推断的基本概念
一、抽样推断的意义
二、抽样推断的几个基本概念
一、抽样推断的意义
　　抽样推断是一种非全面调查，是按照随机
原则，从总体中抽取一部分单位进行调查，并
以其结果对总体某一数量特征做出估计和推断
的一种统计方法。
样本
总体
一、抽样推断的意义
　　抽样推断的基本要求是严格按照随机原则抽取样本单位。
　　所谓随机原则，也称同等可能性原则，是指在抽取样本单位时，总体中的每一个单位都有同等被抽中的机会，样本单位的选取完全排除了人的主观意识的作用。这样就使得被抽中的样本单位具有较大的代表性，可以用小部分单位的数值去推算总体的指标数值。
一、抽样推断的意义
　　抽样推断具有如下作用：
　　第一，在不可能进行全面调查的情况下可以使用
抽样推断的方法。
　　第二，有些总体从理论上讲可以进行全面调查，
但实际办不到或没有必要，可以用抽样推断的方法解
决。
　　第三，用于那些具有破坏性与消耗性的产品质量
检查。
　　第四，对全面调查资料进行评价与修正。
　　第五，用于工业生产管理。
　　第六，抽样推断能节省人力、物力、财力和时间，
比较灵活。
二、抽样推断的几个基本概念
　
　　抽样推断的几个基本概念（见图5-1）。
图5-1 抽样推断的几个基本概念
　
（一）总体和样本
　　在抽样推断中面临两个不同的总体，即全及总体和样本总体（见图5-2）。
图5-2 全及总体和样本总体关系示意
　
　　全及总体也叫母体，简称总体，是所要认识的研究对象的全体。全及总体的单位数用 N 表示。
　　全及总体按其各单位标志的性质不同可分为变量总体和属性总体。变量总体按其包含的单位数以及相应的变量多少分为无限总体和有限总体。
（一）总体和样本
　
　　样本总体又叫抽样总体、子样，简称样本，是从全及总体中随机抽选出来的单位所组成的小总体。样本总体的单位数称样本容量，用 n 表示。
　　注意：全及总体总是唯一确定的，而样本总体不唯一。
（一）总体和样本
　
　　参数亦称全及指标，是全及总体的数量特征，是根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标。
　　由于全及总体是唯一确定的，故根据全及总体计算的参数也是个定值。
（二）参数和统计量
　
　　对于变量总体，可以有如下一些参数：全及总体平均数、全及总体标准差σ（方差σ2）。
　　设总体变量 X 有 N 个取值 X1，X2，X3，…，XN 则：
（二）参数和统计量
　
　　对于属性总体，可以有如下参数：全及总体成数 P、全及总体标准差　（方差）。
　　设总体 N 个单位中，有 N1 个单位具有某种属性，N0 个单位不具有某种属性，且 N1+N0=N ，则：
属性总体标准差
（二）参数和统计量
　
　　统计量即样本指标，是样本的数量特征，随着样本的不同而变化，是个随机变量。
　　和全及指标相对应的有下列样本指标，并以小写字母来表示：
　　设样本总体有 n 个变量：x1，x2，x3，…，xn，则：
样本平均数
样本标准差
（二）参数和统计量
　
（二）参数和统计量
修正样本标准差
样本方差
修正样本方差
　
（二）参数和统计量
样本标准差
　　对于属性总体来说则有如下对应样本指标：
　　设样本总体 n 个单位中有 n1 个单位具有某种属性， n0 个单位不具有某种属性，且n1 +n0 = n 。则：
　
（三）样本容量与样本个数
　　样本容量是指一个样本所包含的单位数，用 n 来表示。一般地讲，样本单位数达到或超过30个的样本称为大样本，而在30个以下称为小样本。
　　样本个数又称样本可能数目，是指从全及总体中可能抽取的样本个数。一个总体可能抽取多少样本，和样本的容量大小有关，也和抽样的方法有关。
　
（四）抽样误差与抽样平均误差
　　抽样误差是指在遵守随机原则的条件下，用
抽样总体的指标估计或推断全及指标所不可避免
的误差。它包括抽样平均数与总体平均数的差数、抽样成数与总体成数的差数。
　　抽样平均误差是指所有可能组成的样本的抽
样平均数或抽样成数与总体平均数或成数的平均
误差。简称平均误差。
第二节随机抽样方法与抽样分布
一、重复简单随机抽样与抽样分布
二、不重复简单随机抽样和抽样分布
三、抽样分布定理
一、重复简单随机抽样与抽样分布
　　重复简单随机抽样又称重置抽样，是从具有 N 个
单位的总体中随机抽取 n 个单位为样本，每次从总体
中抽取一个单位登记其序号或标志值之后，又将它重
新放回总体参加下一次抽选，连续进行 n 次抽选便构
成了一个容量为 n 的样本。
一、重复简单随机抽样与抽样分布
　　该抽样方法的特点：
　　第一，总共可以构成 Nn 个可能的样本个数，每
个样本被抽取的概率都是相同的；
　　第二，由于是重复抽样，因此在 n 次抽样中，总
体中每个单位在各次抽样中被抽取的概率都相同，n
次抽样就是 n 次相互独立的试验。
一、重复简单随机抽样与抽样分布
　　在重复简单随机抽样时，样本平均数的抽样分布
有数学期望值
样本容量为 n：x1 ， x2 ， … ， xn ，则：
设总体变量有 N 个：X1，X2，… ， XN，则
=
=
=
（代表全及总体平均数）
一、重复简单随机抽样与抽样分布
∵
∴
x1, x2,…, xn相互独立
=
=
=
=
=
=
=
=
=
=
=
=
一、重复简单随机抽样与抽样分布
　　在重复简单随机抽样时，样本平均数的抽样分布
有方差
=
即
=
=
=
=
一、重复简单随机抽样与抽样分布
=
=
∵
x1, x2,…, xn相互独立
=
∴
表示抽样平均误差，则：
用
=
=
=
=
=
　　在重复简单随机抽样时，样本成数的抽样分布有数学期望值 E（p）= P，方差，
一、重复简单随机抽样与抽样分布
　　样本成数的抽样分布是样本成数的概率分布，它
由样本成数的可能取值和与之相应的概率组成。
　　成数的抽样平均误差，也就是样本成数的标准差。
用
其中：P是总体的成数；P（1－P）是总体的方差。
表示样本成数的抽样平均误差。则：
=
=
=
二、不重复简单随机抽样和抽样分布
　　不重复简单随机抽样也称不重置简单随机抽样，
是从具有 N 个单位的总体中随机抽取一个容量为 n
的样本，但每一次抽取一个单位登记其序号或标志
值之后，不再将其重新放回总体参加下一次的抽选。
二、不重复简单随机抽样和抽样分布
　　该抽样方法的特点：
　　（1）总共可构成　　个可能的样本个数，每个
样本被抽取的概率都是相同的。
　　（2）由于是不重复抽样，每抽样一次，总体就
少了一个单位数，因此在 n 次抽样中，每个单位在各
次抽样中被抽取的概率不同，n 次抽样不是相互独立
的 n 次试验。
二、不重复简单随机抽样和抽样分布
　　在不重复抽样时，样本平均数的抽样分布有数学
期望，即样本平均数的平均数等于总体平均
数。
设总体变量有 N 个：X1，X2，… ， XN，则
样本容量为n：x1, x2, … ， xn ，则：
=
=
二、不重复简单随机抽样和抽样分布
　　E（x1）表示抽第一单位为 X1，X2，…，或XN 的平均数，每单位出现的概率相等，均为1/N。
　　E（x2）表示抽第二单位为 X1，X2，…，或XN 的平均数。要第二单位出现 X1 ，由于不重复抽样，则第一单位必须不为 X1 ，所以第一单位不为X1 ，而第二单位为 X1 的概率为：
=
=
=
=
=
二、不重复简单随机抽样和抽样分布
依此类推，有：
所以，
……
二、不重复简单随机抽样和抽样分布
　　在不重复简单随机抽样时，样本平均数的抽样
分布的方差
即
∵
x1, x2,…, xn 非相互独立
二、不重复简单随机抽样和抽样分布
=
∵
=
=
=
=
二、不重复简单随机抽样和抽样分布
又∵
=
=
　　其中：K，L = 1, 2, …, N ；PKL 表示第 i 个被抽中的单位取值为 XK ，第 j 个被抽中的单位取值为 XL 的概率，其概率等于，且
二、不重复简单随机抽样和抽样分布
=
=
=
∴
=
=
∴
=
=
　　在不重复抽样条件下，用表示抽样平均误差（也称抽样标准误差），则：
二、不重复简单随机抽样和抽样分布
=
=
=
　　如果总体单位数很大时，可近似地如上表示。
=
=
　　样本成数的抽样分布是样本成数的概率分布，它由样本成数的可能取值和与之相应的概率组成。
二、不重复简单随机抽样和抽样分布
=
　　在不重复简单随机抽样时，样本成数的抽样分
布有数学期望值E（p）=P，方差
　　如果总体单位数很大时，可近似地表示为：
　　（一）样本平均数的抽样分布定理
　　（二）样本成数的抽样分布定理
　　（三）两个样本平均数差异
的抽样分布定理
　　（四）两个样本成数差异（）
的抽样分布定理
三、抽样分布定理
（一）样本平均数的抽样分布定理
　　（1）如果 n 个样本单位是来自一个数学期望值为，方差为σ2的正态分布总体的随机样本，则样本平均数服从其数学期望值为，方差为σ2 /n 的正态分布；样本统计量
t = 服从标准正态分布。这一定理称正态分布的再生性质。
（一）样本平均数的抽样分布定理
　　（2）对于任意一个数学期望值为，方
差为的总体，当样本容量 n 足够大时，样本平均数趋于数学期望值为，方差为
的正态分布，即样本平均数的分布
将近似地服从期望值为，方差为σ2/n的正
态分布。这一定理称为中心极限定理。
（二）样本成数的抽样分布定理
　　对于任一数学期望值为 P，方差为 P（1－P）的二项分布总体，当 n 足够大时（nP＞5；n（1－P）＞5），样本成数 P 趋于服从数学期望值为 P，方差为的正态分布；样本统计量 t= 趋于服从标准正态分布。这一定理是中心极限定理的推论。
（三）两个样本平均数差异的抽样分布定理
　　（1）如果有两个独立的正态分布总体：
总体Ⅰ有数学期望值a1和方差，总体Ⅱ有数学期望值a2和方差。
　　则总体Ⅰ的样本平均数与总体Ⅱ的样本平均数之差（）服从数学期望值为（），方差为的正态分布（重复抽样），或服从数学期望为（），方差为的正态分布（不重复抽样）；服从标准正态分布。
（三）两个样本平均数差异的抽样分布定理
　　（2）对于任意两个独立的总体，总体Ⅰ有数学期望值a1和方差；总体Ⅱ有数学期望值a2和方差。
　　则当 n1 和 n2 都足够大时，（）近似服从数学期望值为（a1 － a2），方差为的正态分布；近似服从标准正态分布。
（四）两个样本成数差异（p1－p2 ）的抽样分布定理
　　对于任意两个独立的二项分布总体，总体Ⅰ有数学期望值 P1 和方差 P1（1 － P1），总体Ⅱ有数学期望值 P2 和方差 P2（1 － P2）。
　　则当n1 和 n2 都足够大时，（p1－p2）趋于服从数学期望值为（P1－P2）、方差为
的正态分布（不重复抽样）；
趋于服从标准正态分布。
第三节参数估计
一、点估计
二、区间估计
三、必要抽样数目的确定
　　点估计也称定值估计，是用样本的统计量直接估计和代表总体参数，即用样本指标直接代表总体指标的参数估计方法。
　　例如用样本平均数直接估计总体平均数，用样本成数 p 直接估计总体成数 P，用修正样本方差，直接估计总体方差。
一、点估计
　　作为一个优良的估计量应该符合以下三个标准（见图5-3）。
一、点估计
图5-3 优良的点估计量应符合的标准
　　无偏性
　　如果估计量的数学期望值等于总体参数，即，则是的无偏估计量。
一、点估计
　　有效性　　
　　如果对比任何一个估计量，有最小方差，
即，则是的有效估计量。
　　一致性
　　如果估计量，随着样本容量 n 的增大而趋近于，即（ε是个任意小的正数），则是的一致估计量。
　　区间估计就是用点估计量和它的标准误差（抽样平均误差）构成的区间估计总体参数，并说明总体参数落在这样一个区间的可能性或置信度。
　　区间估计必须具备三个基本要素：
　　一是点估计量，可以是样本的平均数，也可以是样本成数 p；
　　二是误差范围，即抽样极限误差Δ，通常都用样本指标（点估计量）±抽样极限误
二、区间估计
差来表示总体指标的估计的区间，这个区间也叫做置信区间；
　　三是置信度F（t）=（1 － α）表示总体指标落入估计区间有百分之几概率保证。
　　 P（样本指标一极限误差≤总体指标≤样本指标十极限误差）＝F（t）=1－α
　　抽样极限误差可以用概率度 t 和抽样平
均误差μ相乘得到，即：
二、区间估计
Δ= t·μ
（一）总体平均数的区间估计
　　用区间估计的方法来估计总体平均数，必须具备三要素：点估计量即样本平均数、平均数的抽样极限误差Δx 和置信度 F（t）。
（二）总体成数的区间估计
　　用区间估计的方法来估计总体成数 P，
同样必须具备三要素：点估计量即样本成数 p，成数的抽样极限误差Δp和置信度F（t）。
　　（一）影响抽样数目的因素
三、必要抽样数目的确定
图5-4 影响抽样数目的因素
（二）必要抽样数目的计算
　　1. 重复抽样条件下平均数的必要抽样数目的确定
因为
故
（二）必要抽样数目的计算
　　2. 重复抽样条件下成数的必要抽样数目的确定
因为
故
（二）必要抽样数目的计算
　　3. 不重复抽样条件下平均数的必要抽样数目的确定
因为
故
（二）必要抽样数目的计算
　　4. 不重复抽样条件下成数的必要抽样数目的确定
因为
故
第四节假设检验
一、假设检验的意义和程序
二、假设检验的内容
三、假设检验的两类错误
一、假设检验的意义和程序
　　假设检验又称显著性检验，是以样本统计量验证
假设的总体参数是否成立的一种统计推断方法，是统
计推断的重要内容。进行假设检验时，通常要预先根
据某些事实假设总体参数θ 等于某一值，即提出原假
设：H：θ=θ0，然后从总体中抽取样本计算样本统
计量，通过比较样本统计量和假设的总体参数值，确
定样本统计量是否有充分的证据支持原假设。如果样
本统计量与假设的总体参数之间没有显著的差异，则
说明原假设可以成立；反之，不能成立。
一、假设检验的意义和程序
总体

抽取随机样本
均值 X = 20

一、假设检验的意义和程序
提出假设
我认为人口的
平均年龄是50岁
作出决策
拒绝假设！
别无选择。
二、假设检验的内容
　　本节主要讨论总体平均数和总体成数的假
设检验，并假定均采用大样本。
　　（一）提出原假设
H0：a=a0；H1：a≠a0
　　或
H0：P=P0；H1：P≠P0
H0：a≥a0；H1： a＜ a0
　　或
H0： a≤a0 ；H1： a＞a0
　　或
H0： P ≥ P0 ； H1： P ＜ P0
　　或
H0： P ≤ P0 ； H1： P ＞ P0
单侧检验
双侧检验
（二）决定检验的显著性水平α及相应的临界值t
图5-5 双侧检验
　　双侧检验（见图5-5）。
（二）决定检验的显著性水平α及相应的临界值t
图5-6 右单侧检验
　　右单侧检验（见图5-6）。
图5-7 左单侧检验
（二）决定检验的显著性水平α及相应的临界值t
　　左单侧检验（见图5-7）。
（三）求 t 值
　　抽取一个随机样本，并从 H0 假设为真出发，计算抽样平均数或抽样成数，再求相应概率区间的概率度 t 值。
三、假设检验的两类错误
图5-8 假设检验的两类错误
　　假设检验的两类错误（见图5-8）。
第一类错误
你不能同时减少两类错误!
三、假设检验的两类错误
第二类错误
　　两类错误的关系（见图5-9）。
图5-9 两类错误的关系
　　抽样推断是一种非全面调查，是按随机原则，从总体中抽取一部分单位进行调查，并以其结果对总体某一数量特征做出估计和推断的一种统计方法。
　　抽样推断涉及下列基本概念：全及总体和样本总体、参数和统计量、样本容量与样本个数、抽样误差与抽样平均误差。
　　随机抽样的方法可以有重复简单随机抽样和不重复简单随机抽样。
　　在重简单随机抽样条件下，样本平均数的抽样分布
　　在重复简单随机抽样条件下，样本成数的抽样分布
　　在不重复简单随机抽样条件下，样本平均数的抽样分布
　　在不重复简单随机抽样条件下，样本成数的抽样分布
　　参数估计的方法可以有点估计和区间估计两种。区间估计必须具备三个基本要素：一是点估计量；二是误差范围；三是置信度。
　　用区间估计的方法来估计总体平均数
　　用区间估计的方法来估计总体成数
　　假设检验又称显著性检验，是以样本统计量验证假设的总体参数是否成立的一种统计推断方法。
　　假设检验的程序是：
　　① 提出原假设 H0 和备选假设 H1 ；
　　② 选择显著性水平α；
　　③ 计算检验统计量；
　　④ 判断。
什么是抽样推断？它有哪些基本的特点？
什么是随机原则？在抽样调查中为什么要坚持随机原则？
什么是置信度？什么是置信区间？两者有什么联系？
进行简单随机抽样，假定抽样单位增加3倍，则抽样平均误差将发生如何变化？如果要求抽样误差减少20%，其样本单位数应如何调整？

展开更多......

收起↑

请用微信扫码

5章 抽样推断 课件(共76张PPT)- 《统计学概论》同步教学（高教版）

5章 抽样推断 课件(共76张PPT)- 《统计学概论》同步教学（高教版）

5章抽样推断课件(共76张PPT)- 《统计学概论》同步教学（高教版）

5章抽样推断课件(共76张PPT)- 《统计学概论》同步教学（高教版）