资源简介 (共39张PPT)《应用统计学》第五章参数估计应用统计学第一节 参数估计的基本概念第二节 统计量与抽样分布第三节 参数估计第四节 样本容量的确定应用统计学CONTENTS目录第一节 参数估计的基本概念应用统计学全及总体和抽样总体全及总体:研究对象的全体称为全及总体,简称总体,总体容量用N表示抽样总体:从全及总体中按随机原则抽取一部分单位所构成的集合体,简称子样或样本, 样本容量用n表示。当n>30时,称为大样本,当n<30时,称为小样本,n/N称为抽样比例。无特殊说明, 以下所说的样本都是指简单随机样本应用统计学总体指标和样本指标总体指标:根据全及总体计算的综合指标称为总体指标,主要有全及平均数全及成数 、全及方差 和全及标准差样本指标:根据抽样总体计算的综合指标称为抽样指标 主要有样本平均数 、 样本成数 、 样本方差 和样本标准差应用统计学总体指标和样本指标的关系总体指标是唯一确定的,但往往是未知的,称为总体参数样本指标不是唯一的,是随样本不同而变化的随机变量,但抽取出样本后可以计算其数值.应用统计学重复抽样与不重复抽样重复抽样:指从总体中随机抽出一个单位记录其特征后,再放回总体参加下一次抽选,每次抽取时总体单位数相同不重复抽样:从总体中随机抽出一个单位记录其特征后,不再放回总体中,下一个样本单位再从余下的总体单位中抽取,每次抽取时总体单位数不相同应用统计学第二节 统计量与抽样分布应用统计学应用统计学统计量:设 是总体 的样本,是一个连续函数,若此函数不含任何未知参数,则称函数 为一个统计量典型举例:样本均值:样本方差:应用统计学抽样分布:统计量的概率分布称为抽样分布经典分布:0-1分布、二项分布、泊松分布、均匀分布、正态分布、指数分布要点回顾:若统计量 的概率密度函数可表示为:则称该统计量服从均值为 ,方差为 的正态分布,记作分布:设 是相互独立的,且服从标准正态分布 的随机变量,令: ,则称 服从自由度为n的 分布,记作分布的特性:1. 可加性:若 , 且相互独立,则有:2. 分布曲线形状随仅随n变化(自由度)应用统计学不同自由度条件下的 分布图示应用统计学分布:若 , 且 和 是相互独立的,则称:服从自由度为n的 分布,记作:分布性质:1. 分布关于 对称2. 分布曲线的形状随自由度n的变化而变化应用统计学分布:若 , 且 和 是相互独立的,则称:服从自由度为 的 分布,记作:分布性质:1. 若 ,则2. 分布曲线是右偏型,随自由度 变化应用统计学设 是独立同分布的随机变量,且每个随机变量都满足均值为 、方差为 ,则有当 充分大时, 近似的服从 。该定理说明,只要 充分大,不论总体是否服从正态分布,其样本均值都近似的服从正态分布。中心极限定理应用统计学中心极限定理证明了只要样本容量充分大,不论全及总体的变量分布是否属于正态分布,其抽样平均数趋于正态分布,为抽样推断和估计提供了重要的理论依据。应用统计学设 是独立同分布的随机变量,且每个随机变量都服从正态分布,即 ,则有:(1) (2)(3) (4)抽样分布定理应用统计学第三节 参数估计应用统计学参数估计是抽样推断的重要内容之一,参数估计是如何用样本统计量来估计总体参数,如利用样本均值 去估计总体均值 、利用样本方差 去估计总体方差 。参数估计有两种基本方法,一种是点估计,另一种是区间估计。应用统计学基于总体的一个样本来估计总体分布中未知参数的值的问题称为参数的点估计符号声明: :待估计的参数:称为 的估计量:称为 的估计值估计量是一个随机变量,估计值是一个数值一、点估计应用统计学二、区间估计设总体 的分布函数为 ,其中 为未知参数, 是来自总体 的样本,对于给定值 ,确定两个统计量 以及 ,其中 ,若满足:则称区间 是总体参数 的置信水平为 的置信区间(区间估计),其中 和 分别称为置信下限和置信上限, 称为置信水平应用统计学区间估计的类型(1)总体服从从正态分布 ,当 已知时,求 的置信区间(2)总体服从从正态分布 ,当 未知时,求 的置信区间(3)非正态总体或总体分布未知时,求 的置信区间(4)大样本容量下的总体成数的区间估计(5)正态分布总体条件下的总体方差区间估计应用统计学设 是来自总体 的样本,且总体 ,其中 已知,则对于给定的置信度 , 的置信区间为:简记为:总体服从从正态分布 ,当 已知时,求 的置信区间应用统计学设 是来自总体 的样本,且总体 ,其中 未知,则对于给定的置信度 , 的置信区间为:简记为:总体服从从正态分布 ,当 未知时,求 的置信区间应用统计学为了估计一分钟一次广告的平均费用,抽出了35家电视媒体的随机样本。样本均值为20000元,样本标准差为3000元。假定电视台一分钟一次的广告费近似服从正态分布,试计算总体均值的置信度为95%的置信区间。课堂练习应用统计学解:应用统计学当总体分布未知,仅知道总体方差 时,根据中心极限定理,当 充分大时,样本均值 近似服从正态分布,此时,对于给定的置信度 ,总体均值 的置信区间为:非正态总体或总体分布未知时,求 的置信区间应用统计学总体成数的区间估计实际工作中,需要估计某种特征的单位数占总体全部单位数的比例,被成为总体成数,记为P。例:一批电子元件的合格率,中央电视台某电视栏目的收视率,某城镇全部家庭中夫妻不和家庭数所占的比例等等。把样本中某种特征的单位数占样本全部单位数的比例称为样本成数,记为p.应用统计学总体成数的区间估计1. 假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 z3. 总体比例 在1- 置信水平下的置信区间为应用统计学正态分布总体条件下的总体方差区间估计设总体 服从或近似服从正态分布, 是来自总体 的样本,则可知统计量 ,对于给定的置信度 ,总体方差 的置信区间为:简化可得:应用统计学第四节 样本容量的确定应用统计学当利用样本统计量 估计总体参数 时,第一步需要确定的就是样本容量 ,正确的确定样本容量,不但能节约抽样调查消耗, 而且能有效地控制抽样误差应用统计学影响样本容量的因素1.被研究总体的标志值变动程度:体现为总体的方差较大,则需要进行较大样本容量的抽样2.允许的误差范围:若要求推断的精度较高,则需要较大样本容量的抽样3.抽样推断的可信程度:可以理解为置信度应用统计学测定均值的样本单位数在重复抽样时,当 , 已知时,或非正态总体、总体分布未知时的大样本情形,总体均值 的置信区间可表示为:或此时允许误差的公式可表示为:进而可推出测定均值的样本单位数应为:应用统计学测定成数的样本单位数在重复抽样时,大样本条件下,总体成数 π 的置信区间可表示为:此时允许误差的公式可表示为:进而可推出测定均值的样本单位数应为:应用统计学现实中总体成数π往往是未知的,可采用以下替代方法:(1) 用类似的同类资料或历史资料作为近似值,若同时有多个,应选择最接近0.5的比率;(2)用样本成数来代替;(3)在缺乏总体成数π的情况下,可选择π=0.5。应用统计学测定成数的样本单位数例题分析某食品厂要检查本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品。应用统计学解答:当1 =95.45%时,4.55%;查表得25,即应抽查100袋产品。应用统计学应用统计学谢 谢 展开更多...... 收起↑ 资源预览