资源简介 (共43张PPT)第六章 样本及抽样分布第一节 总体与样本第二节 样本分布函数 直方图第三节 样本函数与统计量第四节 抽样分布第三节 样本函数与统计量为了通过对样本观测值的整理、分析、研究,对总体 的某些概率特征作出推断,往往需要考虑各种适用的样本函数因为一组样本 可以看作是一个 维随机变量 所以任何样本函数都是 维随机变量的函数,显然也是随机变量.根据样本 的观测值 计算得到的函数值就是样本函数 的观测值.定义 若样本函数 中不含有任何未知量,则称这类样本函数为统计量。1.样本均值 (1)观测值记为 (2)2.样本方差 (3)观测值记为 (4)数理统计中最常用的统计量及其观测值有:3. 样本标准差 (5)它的观测值记为 (6)4. 样本k 阶原点矩 (7)它的观测值记为 (8)显然,样本的一阶原点矩就是样本均值。5.样本k阶中心矩 (9)它的观测值记为 (10)显然,样本一阶中心矩恒等于零。当样本容量 较大时,相同的样本观测值 往往可能重复出现,为了使计算简化,应先把所得的数据整理,设得到下表:观测值 … 总计频数 …其中 . 于是样本均值 ,样本方差样本二阶中心矩 可以分别按下列公式计算:(11)(12)(13)若总体 的 阶矩 存在独立且与 同分布。故有与样本二阶中心矩显然,当样本容量 充分大时,样本方差是近似相等的则当 时独立且与X同分布 ,所以因为进而由第五章中关于依概率收敛的序列的性质知道其中 为连续函数,这就是下一章所要介绍的矩估计法的理论根据。从而由第五章的大数定理知习题6-31.从某工人生产的铆钉中随机抽取5只,测得其直径分别为(单位:mm):13.7 13.08 13.11 13.11 13.13(1)写出总体、样本、样本值、样本容量(2)求样本观测值的均值、方差。2.设抽样得到样本观测值为38.2 40.2 42.4 37.6 39.2 41.0 44.0 43.2 38.8 40.6计算样本均值、样本标准差、样本方差与样本二阶中心矩。3.设抽样得到100个样本观测值如下:观测值 1 2 3 4 5 6频数 15 21 25 20 12 7计算样本均值、样本方差与样本二阶中心矩。4.设 , 为 的样本均值与样本方差.作数据变换:设 , 为 的样本均值与样本方差,证明(1) (2)5. 从总体中抽取两组样本,其容量分别为 及 ,设两组的样本均值分别为 及 样本方差分别为及 ,把这两组样本合并为一组容量为 的联合样本,证明:(1)联合样本的样本均值(2)联合样本的样本方差第四节 抽样分布统计量的分布称为抽样分布。在使用统计量进行统计推断时常需知道它的分布.当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的.本节介绍来自正态总体的几个常用统计量的分布.今后,我们将看到这些分布在数理统计中有重要的应用.一、三个重要分布为了讨论正态总体下的抽样分布,先引入由正态分布导出的统计量中的三个重要分布,即分布,分布,分布。1. 分布设 是来自总体 的样本,则称统计量(1)服从自由度为 的 分布,记为此处,自由度是指(1)式右端包含独立变量个数分布的概率密度为的图形如图6-3所示。(2)图6-3此结论可推广:设 且相互独立分布的可加性设,并且 独立,则(证明略)则若 ,则有分布的数学期望和方差因故因此又所以 也相互独立由于 相互独立于是则称点 为 的上 分位点分布的分位点定义 设有分布函数 ,若对给定的有(6)当 有密度函数 时,式(6)可写成(7)由上述定义得 分布的上 分位点为(8)如图6-4所示,对于不同的 上 分位点的值已制成表格,可以查用(参见附表4)。图6-4例如 对于 ,查得但该表只详列到 .费歇(R.A.Fisher)曾证明,当 充分大时,近似地有(9)其中 是标准正态分布的上 分位点。利用(8)式可以求得当 时, 分布的上 分位点的近似值例如由(9)式可得(由更详细的表得 )2. 分布设 , ,且 独立服从自由度为 的 分布则称随机变量(10)记为分布又称为学生氏(student)分布分布的概率密度函数为(11 )图6-5中画出了 的图形 的图形关于 对称,当 充分大时,其图形类似于标准正态变量概率密度的图形。事实上,利用 函数的性质可得故当 足够大时, 分布近似于 分布。但对于较小的 , 分布与 分布相差较大(见附表3 与附表2)(12)图6-5的点 为 分布的上 分位点.(见图6-6)分布的分位点对于给定的 , ,称满足条件(13)图6-6由 分布上 分位点的定义及 图形的对称性知在 时,对于常用的 的值,就用正态近似(14)分布的上 分位点可自附表查得.(15)3. 分布设且 独立,则称随机变量服从自由度为 的 分布记为(16)的概率密度为(17)图6-7中画出了 的图形由定义可知,若 则 ( 18)图6-7分布的分位点对于给定的 ,称满足条件(19)的点 为 分布的上 分位点(图6-8)图6-8容易证明等式:(20)利用这个等式,查附录表,可以计算当时的 的值例如F分布的上 分位点有表格可查(见附表 5)二、正态总体统计量分布研究数理统计的问题时,往往需要知道所讨论的统计量 的分布.一般说来,要确定某个统计量的分布是困难的,有的甚至是不可能的.然而,对于总体服从正态分布的情形已经有了详尽的研究.下面我们讨论服从正态分布的总体的统计量的分布.假设 是来自正态总体 的样本,即它们是独立同分布的,皆服从 分布,样本均值与样本方差分别是定理1 设总体 服从正态分布 ,(21)即则因为随机变量 相互独立且与总体 服从相同的正态分布证所以由正态分布的性质可知,它们的线性组合服从正态分布即这个定理的证明从略,我们仅对自由度作一些说明定理2 设总体 服从正态分布 则(1)样本均值 与样本方差 相互独立;(2)统计量 服从自由度 的 分布即(22)虽然是 个随机变量的平方和,但是这些随机变量不是相互独立的 。因为它们的和恒等于零:由样本方差 的定义易知所以统计量由于受到一个条件的约束,所以自由度为上述两定理是正态总体统计推断的基础,因而是十分重要的,下面列举其应用(有些结论我们放在习题6-4中)例1 设 是来自 的样本,则统计量(23)由定理1知,统计量又由定理2知,统计量因为 与 相互独立与 也相互独立所以证于是 ,由 分布的定义可知,统计量例2 设 来自 , 是来自 的两个独立样本,记则统计量(24)由定理1可知,统计量证且 与 相互独立由正态分布的性质知即又由定理2知:因为 与 相互独立, 与 相互独立所以统计量 与 也相互独立因为 与 相互独立,所以由 分布的可加性可知统计量于是,由 分布定义可知,统计量由假设, , 相互独立,则由 分布的定义例3 (续上例)记则(25)证由定理2知注:若两个正态分布的方差 与 不相等,则统计量本节所介绍的几个分布以及几个重要结论,在下面各章中都起着重要的作用。应注意,它们都是在总体为正态这一基本假定下得到的。习题6-4服从自由度为 的 分布2.设总体 服从正态分布 ,总体服从正态分布 ,则统计量1.设总体 服从 分布 , 是已知常数是来自总体 的一个容量为 的简单随机样本,证明:统计量服从自由度为n的 分布。2c3.设 服从 分布,求下列随机变量的分布:4.设 是独立且服从相同分布的随机变量,且每一个 都服从(1)试给出常数 使得 服从 分布并指出它的自由度。(2)试给出常数 使得 服从 分布,并指出它的自由度。5.查表求6.设 ,求常数 ,使7.求总体 的容量分别为10,15的两独立样本均值差的绝对值大于0.3的概率。8.设 为 的一个样本,求9.设在总体 中抽取一容量为16的样本,这里 均为未知,(1)求 ,其中 为样本方差,(2)求 展开更多...... 收起↑ 资源预览