资源简介 (共41张PPT)统计学:思想、方法与应用第5章 参数估计5.1 样本统计量和总体参数5.2 点估计5.3 抽样分布与中心极限定理5.4 区间估计:给结论留一些余地5.5 合适样本量的确定学习目标知道统计量与总体参数的关系;知道什么是点估计和区间估计;了解衡量估计量好坏的标准;熟悉几种抽样分布以及中心极限定理;理解置信区间的概念;能构造总体均值的置信区间或区间估计;能构造总体比例的置信区间或区间估计;确定合适的样本量从数据中提取与研究问题有关的信息,并利用它得到关于现实世界的结论的过程就叫做统计推断(statistical inference)。估计(estimation)是统计推断的重要内容之一。统计推断的另一个主要内容是下一章要介绍的假设检验(hypothesis testing)。尽管样本中的信息并不完全,而且来自于样本的结果一般不等于总体真实值,但是我们还是经常采用样本数据。之所以需要用样本代替总体进行研究,原因在于在通常情况下,我们对整个总体进行全面调查是不可行的,可能是对整个总体进行调查过于费时,对总体进行逐一调查费用过高或者抽样得到的结果就已经满足我们分析的要求,或者检验可能是破坏性的。估计就是根据你拥有的信息来对现实世界进行某种判断。你可以根据一个人的衣着、言谈和举止判断其身份你可以根据一个人的脸色,猜出其心情和身体状况统计中的估计也不例外,它是完全根据数据做出的。如果我们想知道北京人认可某饮料的比例,人们只有在北京人中进行抽样调查以得到样本,并用样本中认可该饮料的比例来估计真实的比例。从不同的样本得到的结论也不会完全一样。虽然真实的比例在这种抽样过程中永远也不知道;但可以知道估计出来的比例和真实的比例大致差多少。5.1 用估计量估计总体参数人们往往先假定某数据来自一个特定的总体族(比如正态分布族)。而要确定是总体族的哪个成员则需要知道总体参数值(比如总体均值和总体方差)。人们于是可以用相应的样本统计量(比如样本均值和样本方差)来估计相应的总体参数。5.1 用估计量估计总体参数一些常见的涉及总体的参数包括总体均值(m)、总体标准差(s)或方差(s2)和(Bernoulli试验中)成功概率p等(总体中含有某种特征的个体之比例)。正态分布族中的成员被(总体)均值和标准差完全确定;Bernoulli分布族的成员被概率(或比例)p完全决定。因此如果能够对这些参数进行估计,总体分布也就估计出来了。5.1 用估计量估计总体参数估计的根据为总体抽取的样本。样本的(不包含未知总体参数的)函数称为统计量;而用于估计的统计量称为估计量(estimator)。由于一个统计量对于不同的样本取值不同,所以,估计量也是随机变量,并有其分布。如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量的一个实现(realization)或取值,也称为一个估计值(estimate)。5.1 用估计量估计总体参数这里介绍两种估计,一种是点估计(point estimation),即用估计量的实现值来近似相应的总体参数。另一种是区间估计(interval estimation);它是包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。5.2 点估计用什么样的估计量来估计参数呢?实际上没有硬性限制。任何统计量,只要人们觉得合适就可以当成估计量。当然,统计学家想出了许多标准来衡量一个估计量的好坏。每个标准一般都仅反映估计量的某个方面。这样就出现了按照这些标准定义的各种名目的估计量(如无偏估计量等)。另一些估计量则是由它们的计算方式来命名的(如最大似然估计和矩估计等)。5.2 点估计最常用的估计量就是我们熟悉的样本均值、样本标准差(s)和(Bernoulli试验的)成功比例(x/n);人们用它们来分别估计总体均值(m)、总体标准差(s)和成功概率(或总体中的比例)p。这些在前面都已经介绍过,大家也知道如何通过计算机(或公式)来计算它们。5.2 点估计那么,什么是好估计量的标准呢?一种统计量称为无偏估计量(unbiased estimator)。所谓的无偏性(unbiasedness)就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的参数。5.2 点估计由于一般仅仅抽取一个样本,并且用该样本的这个估计量的实现来估计对应的参数,人们并不知道这个估计值和要估计的参数差多少。因此,无偏性仅仅是非常多次重复抽样时的一个渐近概念。随机样本产生的样本均值、样本标准差和Bernoulli试验的成功比例分别都是相应的总体均值、总体标准差和总体比例的无偏估计。5.2 点估计在无偏估计量的类中,人们还希望寻找方差最小的估计量,称为最小方差无偏估计量。此因为方差小说明反复抽样产生的许多估计量差别不大,因此更加精确。评价一个统计量好坏的标准很多;而且许多都涉及一些大样本的极限性质。我们不想在这里涉及太多此方面的细节。5.3 抽样分布与中心极限定理相同样本量的样本统计量会随着样本不同而不同,即样本统计量作为随机样本的函数也是随机的,也有自己的分布,这些分布就称为抽样分布(sampling distribution)。5.3.1 样本均值的抽样分布很容易得到左表的总体均值 =2056.5元。为获得样本均值的抽样分布,假设样本量取为2,右表列出了所有15种可能的样本和相应的总和及样本均值。显然这些样本均值都和真正的总体均值2056.5元有些差别,但是这15个样本均值的平均值 却为2056.5元。x1 x2 x3 x4 x5 x61427 1716 1844 2037 2366 2949样本 组合 总和1 X1,X2 3143 1571.52 X1,X3 3271 1635.53 X1,X4 3464 17324 X1,X5 3793 1896.55 X1,X6 4376 21886 X2,X3 3560 17807 X2,X4 3753 1876.58 X2,X5 4082 20419 X2,X6 4665 2332.510 X3,X4 3881 1940.511 X3,X5 4210 210512 X3,X6 4793 2396.513 X4,X5 4403 2201.514 X4,X6 4986 249315 X5,X6 5315 2657.55.3.1 样本均值的抽样分布图5.2描绘了总体分布和样本均值分布情况。5.3.1 样本均值的抽样分布可得到如下的结论:(1)样本均值分布的均值等于总体均值: 。(2)样本均值分布的延伸范围小于总体分布。样本均值的起止点分别为1571.5元和2657.5元,而总体值则从1427元至2949元不等。事实上,样本均值分布的标准差等于总体标准差除以样本量的算术平方根,即为 。注意到如果我们增加样本量,那么样本均值分布的范围将缩小。(3)样本均值的抽样分布形态与总体频数分布形态不同。样本均值分布更接近钟形,近似于正态概率分布。5.3.2 中心极限定理中心极限定理的准确叙述如下:若给定样本量的所有样本来自任意总体,则样本均值的抽样分布近似服从正态分布,且样本量越大,近似性越强。为了直观地说明中心极限定理的意义,我们从在(0,1)的均匀分布对于四种样本量大小n=1,2,5,20分别取1000个样本,对每个样本算出均值,于是对每一种样本量都有1000个均值,用这些均值画出下面的直方图5.3。从图中可以看出,样本量越大,均值的直方图越像正态变量的直方图,而且数据的分散程度也越小(越集中)。5.3.2 中心极限定理5.3.2 中心极限定理根据中心极限定理可知,样本均值 作为随机变量有如下的性质(注意,这里并没有假定X的分布):(1)如果能够选择给定总体的特定容量的所有可能样本,那么,样本均值的抽样分布的均值将恰好等于总体均值 ,即使我们不能得到所有样本,但可以预计,样本均值分布的均值会接近于总体均值。(2)样本均值的抽样分布的离散程度小于总体分布。若总体标准差是 ,则样本均值的抽样分布的标准差为 。当增大样本量时, 值将变小,即 的集中程度越大。(3)即使X的分布不是正态,那么在很一般的条件下,当样本量增加时, 的分布趋近于正态分布 。5.4 区间估计当描述一个人的体重时,你一般可能不会说这个人是76.35公斤你会说这个人是七八十公斤,或者是在70公斤到80公斤之间。这个范围就是区间估计的例子。5.4 区间估计在抽样调查例子中也常用点估计加区间估计的说法。比如,为了估计某电视节目在观众中的支持率(即总体比例p),某调查结果会显示,该节目的“收视率为90%,误差是±3%,置信度为95%”云云。这这种说法意味着下面三点5.4 区间估计1. 样本中的支持率为90%,即用样本比例作为对总体比例的点估计2. 估计范围为90%±3%(±3%的误差),即区间(93%,87%)。3. 如用类似的方式,重复抽取大量(样本量相同的)样本时,产生的大量类似区间中有些会覆盖真正的p,而有些不会;但其中大约有95%会覆盖真正的总体比例。5.4 区间估计这样得到的区间被称为总体比例p的置信度(confidence level)为95%的置信区间(confidence interval)。这里的置信度又称置信水平或置信系数。显然置信度的概念又是大量重复抽样时的一个渐近概念。5.4 区间估计因此说“我们目前得到的区间(比如上面的90%±3%)以概率0.95覆盖真正的比例p”是个错误的说法。这里的区间(93%,87%)是固定的,而总体比例p也是固定的值。因此只有两种可能:或者该区间包含总体比例,或者不包含;在固定数值之间没有任何概率可言。5.4 区间估计例5.1(noodle.txt)某厂家生产的挂面包装上写明“净含量450克”。在用天平称量了商场中的48包挂面之后,得到样本量为48的关于挂面重量(单位:克)的一个样本:用计算机可以很容易地得到挂面重量的样本均值、总体均值的置信区间等等。下面是SPSS的输出:该输出给出了许多第三章引进的描述统计量。和估计有关的是作为总体均点估计的样本均值,它等于449.01;而总体均值的95%置信区间为(447.41,450.61)5.4 区间估计我们还可以构造两个总体的均值(或比例)之差的置信区间。如想知道两个地区学生成绩的差异,可以建造两个地区成绩均值之差m1- m2的置信区间。如想比较一个候选人在不同阶段支持率的差异,那就可构造比例之差p1-p2的置信区间。5.4 区间估计例5.2有两个地区大学生的高度数据(height2.txt)(a)我们想要分别得到这两个总体均值和标准差的点估计(即样本均值和样本标准差)和各总体均值的95%置信区间。(b)求两个均值差m1-m2的点估计和95%置信区间。利用软件很容易得到下面结果:5.4 区间估计两个总体均值估计量的样本均值分别为170.56和165.60,样本标准差分别为6.97857和7.55659;还得到均值的置信区间分别是(168.5767, 172.5433),(163.4524, 167.7476)。可以得到两个样本均值的差(4.9600),另外还给出了两总体均值差的95%置信区间(2.073,7.847)。5.4 关于置信区间的注意点前面提到,不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。置信度95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率;也就是说,无穷次重复抽样所得到的所有区间中有95%包含参数。5.4 关于置信区间的注意点但是把一个样本数据带入统计量的公式所得到的一个区间,只是这些区间中的一个。这个非随机的区间是否包含那个非随机的总体参数,谁也不可能知道。非随机的数目之间没有概率可言。5.4 关于置信区间的注意点置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。5.4 关于置信区间的注意点一个描述性例子:有10000个人回答的调查显示,同意某观点人的比例为70%(有7000人同意),可算出总体中同意该观点的比例的95%置信区间为(0.691,0.709);另一个调查声称有70%的比例反对该种观点,还说总体中反对该观点的置信区间也是(0.691,0.709)。到底相信谁呢?实际上,第二个调查隐瞒了置信度。如果第二个调查仅仅调查了50个人,有35个人反对该观点。则其置信区间的置信度仅有11%。5.5 合适样本量的确定5.5.1 估计总体比例时样本量的确定调查研究中一个经常需要关心的问题是“样本量要多大才行?”样本量过大不经济,样本量过小又不能保证估计的精度。确定合适的样本量需要考虑以下三方面因素:(1)希望达到的置信度。置信度越高,样本量越大。(2)研究者可以承受的误差范围。可容许误差越小要求样本量越大,反之则样本量越小。(3)所研究总体比例的估计。5.5.1 估计总体比例时样本量的确定将上述三方面结合起来,得到总体比例的样本量由下面的公式确定:其中: 是对应于某置信度的标准正态分布值;E是最大可容许误差。可以从预调查或者其他途径得到总体比例 的估计,否则我们就用0.50作为估计值。上式的结果通常并不是整数。当出现这种情况时,我们取不小于该数的最小整数。5.5.1 估计总体比例时样本量的确定例5.13 假如一个学公共管理的学生想估计有专职垃圾收集工人的城市的比例。他希望对总体比例的估计的误差不超过总体比例的0.10,置信度为90%,总体比例的估计未知,计算所需样本量。因为假设估计总体比例的最大误差E为0.10,置信度为0.90,相应的z值为1.65。由于总体比例的估计未知,取其为0.50,于是所需的样本量为:于是我们建议的样本量为69。如果我们要提高置信度到99%,则样本量应相应增加,在99%的置信度下对应的z值为2.58,此时样本量为我们推荐样本量为167。因此,当置信度由95%提高到99%时,样本量增加97。这会大大增加调查的时间和成本,因此置信度的选择应该慎重。5.5.2 估计总体均值时样本量的确定关于均值估计问题样本量的确定与上面的过程基本一致,也有三个因素需要确定:(1)希望达到的置信度。(2)研究者可以承受的误差大小。(3)总体的标准差的估计。前两个因素与总体比例的样本量估计情况是一致的,不一样的地方是此处要估计总体的标准差。在通常的情况下我们并不知道总体标准差,因此我们必须对其进行估计。5.5.2 估计总体均值时样本量的确定将上述三方面结合起来,得到总体比例的样本量由下面的公式确定:其中: 是对应于某置信度的标准正态分布值;E是最大可容许误差。可以从预调查或者其他途径得到总体比例 的估计,否则我们就用0.50作为估计值。上式的结果通常并不是整数。当出现这种情况时,我们取不小于该数的最小整数。5.5.2 估计总体均值时样本量的确定例5.14 一个学公共管理的学生还想了解在大城市中从事政策咨询的顾问每月可以得到多少酬劳。在95%的置信度下,要求均值的估计误差不超过100元。此外他从劳动部得到的资料估计总体标准差约为1000元。计算需要的样本量。因为假设最大可容许误差E为100元,95%的置信度所对应的z值为1.96 ,总体标准差的估计为1000元。将数据代入估计总体均值所需样本量的公式可得到样本量为:结果为384.16,实际取为385。样本量385可以满足他的要求。如果我们要提高置信度到99%,则样本量应相应增加,在99%的置信度下对应的z值为2.58,此时样本量为我们推荐样本量为666。类似于总体比例的样本量的情况,同样可发现,当置信度由95%提高到99%时,样本量增加281,因此置信度的选择应该慎重。 展开更多...... 收起↑ 资源预览