资源简介 (共30张PPT)管理统计学3 参数估计3.1 基本原理3.2 点估计3.3 区间估计3.1 基本概念估计量与估计值抽样估计/参数估计:用样本统计量估计总体参数的特征值估计量:用来估计总体参数的统计量名称估计值:用来估计总体参数,是计算出来的估计量的具体数值科学的抽样估计方法要有合适的统计量作为估计量要有合理的允许误差范围要有一个可接受的置信度3.1 基本原理统计估计值关系式参数估计方法点估计区间估计样本数据所估计估计值+参数方法偏差抽样误差=+总体真正的特性不当抽样所造成抽样对象不同所造成3.2.1 点估计的概念点估计是以样本统计量作为相应总体参数的估计量例如:用样本均值 直接作为总体均值 的估计值点估计的优点能够提供总体参数的具体估计值,可以作为行动决策的数量依据点估计的不足任何点估计不是对就是错,并不能提供误差情况如何、误差程度有多大的信息3.2.2 点估计的优良性标准无偏性设总体的参数为 ,其估计量为 ,如果 即估计量 的数学期望等于被估计的总体参数,我们称估计量 是参数 的无偏估计量样本平均数是总体平均数的无偏估计量无偏性是对估计量的一个常见而重要的要求无偏性的实际意义是指没有系统性的偏差点估计的优良标准(续)相合性/一致性设 是参数 估计量,若对于任意的 ,当 时 依概率收敛于 ,则称 为 的相合估计量对任意 有,有效性设 和 都是参数的无偏估计量,若对任意 , ,且至少对于某个 上式中的不等号成立,则称 较 有效矩法矩估计法:英国统计学家K.皮尔逊最早提出由辛钦定理 ,若总体 的数学期望 有限,则有矩法的定义用样本原点矩估计相应的总体原点矩用样本原点矩的连续函数估计相应的总体原点矩的连续函数矩法的优点简单易行,并不需要事先知道总体是什么分布矩法的缺点当总体类型已知时,没有充分利用分布提供的信息;一般场合下,矩估计量不具有唯一性其中 为连续函数矩法的具体步骤设总体的分布函数中含有k个未知参数 那么它的前k阶矩 ,从这 k 个方程中解出用诸 的估计量 分别代替上式中的诸可得诸 的矩估计量:矩估计量的观察值为矩估计值例3.1 矩法估计例题设总体 , 为总体的样本,求 , 的矩法估计量。解:例3.2 灯泡平均寿命分析设从某灯泡厂某天生产的灯泡中随机抽取10只灯泡,测得其寿命为(单位:小时)1050,1100,1080,1120,1200,1250,1040,1130,1300,1200。试用矩法估计该厂这天生产的灯泡的平均寿命及寿命分布的方差。解:极大似然估计的基本概念一种在总体类型已知条件下使用的参数估计方法首先是由德国数学家高斯在1821年提出的,费歇在1922年重新发现了这一方法,并首先研究了这种方法的一些性质原理如果一个随机试验有若干种可能的条件,若在一次试验中,结果A出现,则一般认为试验条件对A出现有利在试验的诸多可能条件中,认为使事件A发生的概率最大的那种条件成立极大似然估计的基本概念(续)似然函数设 是取自总体 的一个样本样本的联合密度(连续型)或联合分布律 (离散型)为当给定样本 时,定义似然函数为:是样本的观察值极大似然估计法用使 达到最大值的 去估计求极大似然估计的一般步骤写出似然函数对似然函数取对数,并整理求导数解似然方程称 为 的最大似然估计值称为 的最大似然估计量例3.4 极大似然估计例题设总体X服从N( , ),是X 的样本值,求 , 的极大似然估计解:似然方程为: ,S2的极大似然估计量分别为 ,,频次分析模块Analyz→Descriptive Statistics → Frequencies Statistics均值中位数众数样本数据值总和数据分布的斜度数据分布的峰度最大值与最小值之差标准差方差均值标准差最大值最小值计算四分点按顺序分组设置指定的百分点频次分析模块(续)Statistics净重N Valid 100Missing 0Mean 343.76Std. Deviation 4.130Variance 17.053从100个样本中推断总体的净重均值为343.76g,方差为17.053从100个样本中推断总体的净重均值为343.76g,方差为17.053从100个样本中推断总体的净重均值为343.76g,方差为17.053样本方差样本均值描述统计模块Analyze→Descriptive Statistics→Descriptives→Options标准差均值方差Descriptive StatisticsN Mean Std. Deviation Variance净重 100 343.76 4.130 17.053Valid N (listwise) 100净重均值、方差估计值,结果同Statistics表标准差均值方差标准差均值净重均值、方差估计值,结果同Statistics表方差标准差均值标准差均值标准差均值方差标准差均值3.3 区间估计用一个区间去估计未知参数, 即把未知参数值估计在某两界限之间设 是来自密度 的样本对给定的 ,如能找到两个统计量 及 ,使得是置信度,置信度也称为置信概率是置信度为 的θ的置信区间称为显著性水平(Significance Level)。置信区间区间示意图置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠的概率可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度3.3.1 总体方差 已知时,总体均值 的估计, 为来自总体的样本样本均值 服从数学期望为μ、方差为 /n的正态分布,即当 已知时,可得到1-α置信度下,μ的置信区间为置信区间的宽度为:例3.6 零件直径问题已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5mm,已知总体标准差σ=2.5mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。解:已知 , =202.5mm,n=10, =0.95,查标准正态分布表,得 =1.96,所以在 置信度下, 的置信区间为即[202.5-1.96×2.5/ ,202.5+1.96×2.5/ ],计算结果为:[200.95,204.05]3.3.2 总体方差 未知时,总体均值 的估计n≥30时通常用样本方差 来估计,只需将 中的σ用S 近似代替即可n<30时即1-α置信度下,μ的置信区间为例3.7 大学生平均完成作业时间某大学从该校学生中随机抽取100人,调查到他们平均每人每天完成作业的时间为120分钟,样本标准差为30分钟,试以95%的置信水平估计该大学平均每天完成作业时间。解: 根据题意可知:=120,S=30,n=100且 =0.95, =1.96故在95%的置信度下, 的置信区间为即[120-1.96×30/10,120+1.96×30/10],计算结果为:[114.12,125.88]3.3.3 总体方差的区间估计由于当总体为正态分布时,其中所以在1-α置信度下, 的置信区间为3.3.4 总体比率的区间估计总体比率总体比率: p=M/N设 N为总体容量,M 为具有某种特点(性质)的元素数样本比率样本比率:从N中抽取n个为样本,其中具有某种特点的元素数为X(X=0,1,…,n )3.3.4 总体比率的区间估计给定置信度为1-α时 ,有总体比例p在1- 置信水平下的置信区间为( 未知时)例3.9 城市下岗女职工比例某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。解:已知n=100,p=65%,1- =95%, =1.96故该城市下岗职工中女性比例的置信区间为55.65%~74.35%3.3.5 区间估计的SPSS应用Analyze→Descriptive Statistics→Explore→Statistics输出均数、中位数、众数、标准误、方差等置信区间,默认为95%中心趋势的最大似然确定输出五个最大值与五个最小值输出分位数输出五个最大值与五个最小值输出分位数Statistic Std. Error灯泡寿命 Mean 1490.0000 6.1913995% Confidence Interval for Mean Lower Bound 1476.8034Upper Bound 1503.19665% Trimmed Mean 1490.0000Median 1485.0000Variance 613.333Std. Deviation 24.76557Minimum 1450.00Maximum 1530.00Range 80.00Interquartile Range 40.0000Skewness .030 .564Kurtosis -1.272 1.091样本标准差样本均值置信区间为[1476.8034,1503.1966] 展开更多...... 收起↑ 资源预览