资源简介 (共99张PPT)统计学Statistics第01章 绪论第02章 统计数据的收集第03章 统计数据的整理第04章 描述性统计第05章 抽样第06章 参数估计第07章 假设检验第08章 方差分析第09章 时间序列分析第10章 统计指数第11章 相关回归分析授课内容序号 实验项目 内容提要 实验 类型 学时 分配 主要仪器 设 备 实验 地点 备注1 统计工作过程实验 安排学生自己设计、印制、发放、整理、分析统计调查表 设计性实验 2 不限2 Excel在统计分析中的应用 应用Excel进行统计计算和分析 验证性实验 20 计算机 计算机房 计算机装有Excel软件,并安装“数据分析”功能;计算器具备单、双变量统计功能3 统计学知识综合运用 分别用计算器、Excel、和手工进行相关与回归分析、时间数列分析及抽样推断 综合性实验 2 计算机、计算器 计算机房 实验项目一览表推断统计参数估计假设检验通过样本统计量估计总体参数对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。第六章 参数估计第六章 参数估计第六章 参数估计第六章 参数估计理论部分第六章 参数估计 是推断统计的重要内容之一。它是在抽样及抽样分布的基础上,根据样本统计量来推断总体的参数。参数估计 参数估计的方法有点估计和区间估计。 估计量:用于估计总体参数的随机变量。 如样本均值,样本比例、样本方差等。 估计值:估计参数时计算出来的统计量的具体值。 如果样本均值 ,则80就是 的估计值 点估计:就是用样本统计量的某个取值直接作为总体参数的估计值。 区间估计:在点估计的基础上,给出总体参数估计的一个区间范围。该区间范围通常用样本统计量加减抽样误差得到。比如,某班级平均分数在75~85之间,置信水平是95%样本统计量(点估计值)置信区间置信下限置信上限 置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间。其中区间的最小值称为置信下限,最大值称为置信上限。比如,某班级平均分数在75~85之间,置信水平是95%样本统计量(点估计值)置信区间置信下限置信上限 置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。重复构造出 的20个置信区间 点估计值比如,某班级平均分数在75~85之间,置信水平是95%样本统计量(点估计值)置信区间置信下限置信上限 置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。表示为 (1 - ), 为总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90%均值的抽样分布(1 - ) 区间包含了 的区间未包含 1 – aa /2a /268.27%95.45%99.73%68.27%68.27%95.45%99.73%95.45%68.27%95.45%99.73%99.73%x95% 的样本99% 的样本90%的样本可查标准正态分布表。常用的几个概率度与置信概率的对应关系如下:z=1F(z)=68.27%z=1.64F(z)=90%z=1.96F(z)=95%z=2F(z)=95.45%z=2.58F(z)=99%z=3F(z)=99.73% 总体数据的离散程度,用 来测度 样本容量 置信水平 (1 - ) ,影响 z 的大小影响置信区间宽度的因素 点估计:就是用样本统计量的某个取值直接作为总体参数的估计值。 区间估计:在点估计的基础上,给出总体参数估计的一个区间范围。该区间范围通常用样本统计量加减抽样误差得到。 无偏性:估计量抽样分布的数学期望等于被 估计的总体参数。P( )BA无偏有偏 无偏性:估计量抽样分布的数学期望等于被 估计的总体参数。 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 。AB的抽样分布的抽样分布P( ) 无偏性:估计量抽样分布的数学期望等于被 估计的总体参数。 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 。 一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量P( )第六章 参数估计第六章 参数估计假定条件: 总体服从正态分布,且方差( 2)已知 如果不是正态分布,可由正态分布来近似 (n>= 30) 使用正态分布统计量 z 总体均值 在1- 置信水平下的置信区间为【 例 】一家食品生产企业以生产袋装食品为主,为对产品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量(单位:g)如右表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量 112.5 101.0 103.0 102.0 100.5102.6 107.5 95.0 108.8 115.6100.0 123.5 102.0 101.6 102.2116.6 95.4 97.8 108.6 105.0136.8 102.8 101.5 98.4 93.3解:已知X~N( ,102),n=25, 1- = 95%,z /2=1.96。根据样本数据计算得: 。由于是正态总体,且方差已知。总体均值 在1- 置信水平下的置信区间为:该食品平均重量的置信区间为101.44g~109.28g【 例 】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如右表。试建立投保人年龄90%的置信区间。36个投保人年龄的数据 23 35 39 27 36 4436 42 46 43 31 3342 53 45 54 47 2434 28 39 36 44 4039 49 38 34 48 5034 39 45 48 45 32解:已知n=36, 1- = 90%,z /2=1.645。根据样本数据计算得: ,总体均值 在 1- 置信水平下的置信区间为:投保人平均年龄的置信区间为37.37岁—41.63岁假定条件: 总体服从正态分布,但方差( 2) 未知 小样本 (n < 30) 使用 t 分布统计量 总体均值 在1- 置信水平下的置信区间为 类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布。t分布t分布xt 分布与标准正态分布的比较t 分布标准正态分布t不同自由度的t分布标准正态分布t (df = 13)t (df = 5)z【 例 】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如右表。建立该批灯泡平均使用寿命95%的置信区间。16只灯泡使用寿命的数据 1510 1520 1480 15001450 1480 1510 15201480 1490 1530 15101460 1460 1470 1470该种灯泡平均使用寿命的置信区间为1476.8h~1503.2h解:已知X~N( , 2),n=16, 1- = 95%,t /2=2.131根据样本数据计算得: ,总体均值 在1- 置信水平下的置信区间为: 使用正态分布统计量 z假定条件: 总体服从二项分布 可以由正态分布来近似 总体比例 在1- 置信水平下的置信区间为x f' xf'1 p p0 1-p 0拓展:比例的均值和方差计算【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知 n=100,p=65% , 1- = 95%,z /2=1.96该城市下岗职工中女性比例的置信区间为55.65%—74.35% 总体方差 2 的点估计量为 s2,且假定条件: 总体服从正态分布 总体方差在1- 置信水平下的置信区间为 2 21- 2 总体方差1- 的置信区间自由度为n-1的 2【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如右表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间25袋食品的重量 单位:g 112.5 101.0 103.0 102.0 100.5102.6 107.5 95.0 108.8 115.6100.0 123.5 102.0 101.6 102.2116.6 95.4 97.8 108.6 105.0136.8 102.8 101.5 98.4 93.3解:已知n=25,1- =95% ,根据样本数据计算得s2 =93.21 2置信度为95%的置信区间为该企业生产的食品总体重量标准差的的置信区间为7.54g~13.43g第六章 参数估计第六章 参数估计总体 参数 符号表示 样本统计量均值差比例差方差比 假定条件 两个总体都服从正态分布, 12 , 22已知 若不是正态分布, 可以用正态分布来近似(n1 30和n2 30) 两个样本是独立的随机样本两个均值之差的区间估计(大样本) 使用正态分布统计量 z两个均值之差的区间估计(大样本) 12 , 22未知时,两个总体均值之差 1- 2在1- 置信水平下的置信区间为 12, 22已知时,两个总体均值之差 1- 2在1- 置信水平下的置信区间为 两个均值之差的区间估计(大样本)【例】某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如下表所示 。建立两所中学高考英语平均分数之差95%的置信区间 两个样本的有关数据 中学1 中学2n1=46 n1=33S1=5.8 S2=7.2两个均值之差的区间估计(大样本)解: 两个总体均值之差在1- 置信水平下的置信区间为两所中学高考英语平均分数之差的置信区间为5.03分~10.97分 假定条件 两个总体都服从正态分布 两个总体方差未知但相等: 两个独立的小样本 (n1<30和n2<30)两个均值之差的区间估计(小样本) 总体方差的合并估计量两个均值之差的区间估计(小样本) 两个样本均值之差的标准化 估计量 的抽样标准差两个均值之差的区间估计(小样本) 两个总体均值之差 1- 2在1- 置信水平下的置信区间两个均值之差的区间估计(小样本)【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(单位:min) 如右表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间 方法1 方法2 28.3 36.0 27.6 31.730.1 37.2 22.2 26.029.0 38.5 31.0 32.037.6 34.4 33.8 31.232.1 28.0 20.0 33.428.8 30.0 30.2 26.5两个均值之差的区间估计(小样本)解:根据样本数据计算得合并估计量为两种方法组装产品所需平均时间之差的置信区间为0.14min~7.26min 假定条件 两个总体都服从正态分布 可以用正态分布来近似 两个样本是独立的随机样本两个总体比例之差的区间估计 两个总体比例之差 1- 2在1- 置信水平下的置信区间为【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率差别的置信区间。两个总体比例之差的区间估计解: 已知 n1=500 ,n2=400, p1=45%, p2=32%,1- =95%, z /2=1.96 1- 2置信度为95%的置信区间为两个总体比例之差的区间估计城市与农村收视率差值的置信区间为6.68%~19.32% 比较两个总体的方差比 如果S12/ S22接近于1,说明两个总体方差很接近 如果S12/ S22远离1,说明两个总体方差存在差异两个总体方差比的区间估计 总体方差比在1- 置信水平下的置信区间为两个总体方差比的区间估计FF1- F 总体方差比1- 的置信区间方差比置信区间示意图两个总体方差比的区间估计【例】为了研究男女学生在生活费支出(单位:元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果:男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间两个总体方差比的区间估计解:根据自由度 n1=25-1=24 ,n2=25-1=24,查得 F /2(24,24)=1.98, F1- /2(24,24)=1/1.98=0.505 12 / 22置信度为90%的置信区间为男女学生生活费支出方差比的置信区间为0.47~1.84第六章 参数估计第六章 参数估计必要样本容量在实际问题中,需要自己动手设计调查方案,这时,如何决定样本n的大小是非常关键的,如果使用比需要大的样本,就会浪费资源;如果样本容量在估计的精确度上不能满足,就不能达到分析目的。但可靠度和精确度是一对矛盾,因此,一般原则是在保证达到预期的可靠程度和精度的要求下,抽取必要的样本单位数。估计总体均值时样本容量的确定样本容量n与总体方差 2、极限误差△、可靠性系数Z或t之间的关系为: 与总体方差成正比 与极限误差的平方成反比 与可靠性系数成正比估计总体比例时样本容量的确定估计两个总体均值之差时样本容量的确定设n1和n2为来自两个总体的样本,并假定n1=n2 根据均值之差的区间估计公式可得两个样本的容量n为估计两个总体比例之差时样本容量的确定 设n1和n2为来自两个总体的样本,并假定n1=n2 根据均值之差的区间估计公式可得两个样本的容量n为正态分布NorminvNormdistNormsinvNormsdistNorm.invNorm.distNorm.s.invNorm.s.distt分布Tinv(双尾)TdistT.inv(左尾)T.inv.2T(双尾)T.dist(左尾)T.dist.2T(双尾)T.dist.RT(右尾)卡方分布Chiinv(右尾)Chidist(右尾)Chisq.inv(左尾)Chisq.inv.RT(右尾)Chisq.distChisq.dist.RT(右尾)F分布Finv(右尾)Fdist(右尾)F.inv(左尾)F.inv.RT(右尾)F.distF.dist.RT(右尾) 随机抽样 抽样分布 参数估计的Excel应用上机内容 展开更多...... 收起↑ 资源预览