资源简介 (共97张PPT)应用统计学Applied Statistics第01章 绪论第02章 统计数据的收集第03章 统计数据的整理第04章 描述性统计第05章 抽样第06章 参数估计第07章 假设检验第08章 方差分析第09章 时间序列分析第10章 统计指数第11章 相关回归分析授课内容序号 实验项目 内容提要 实验 类型 学时 分配 主要仪器 设 备 实验 地点 备注1 统计工作过程实验 安排学生自己设计、印制、发放、整理、分析统计调查表 设计性实验 2 不限2 Excel在统计分析中的应用 应用Excel进行统计计算和分析 验证性实验 20 计算机 计算机房 计算机装有Excel软件,并安装“数据分析”功能;计算器具备单、双变量统计功能3 统计学知识综合运用 分别用计算器、Excel、和手工进行相关与回归分析、时间数列分析及推断统计 综合性实验 2 计算机、计算器 计算机房 实验项目一览表第七章 假设检验第七章 假设检验第七章 假设检验第七章 假设检验理论部分第七章 假设检验 是推断统计的重要内容之一。它是根据原始资料,在未知总体参数的情况下,先对总体参数及某一随机变量服从某种分布的假设,然后利用样本资料计算相关的检验统计量,在一定的概率下,以可接受的风险来判断估计数值与总体数值是否存在着显著的差异。假设检验推断统计参数估计假设检验通过样本统计量估计总体参数对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。 例:某食品厂用自动装罐头机装罐头食品,每罐头标准重量为0.5公斤,按以往的生产经验,标准差为0.01公斤.每隔一定时间需要检查机器工作情况.现随机抽取10罐,称其重量为: 0.498,0.512,0.503,0.510,0.497,0.489,0.506,0.500,0.499,0.505.假定重量服从正态分布,试问机器工作是否正常 H0:μ= μ0=0.5H1:μ≠μ0=0.5假设检验推断统计参数估计通过样本统计量估计总体参数对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。假设检验假设检验参数检验非参数检验总体分布形式已知,检验的目的是对总体的参数及其性质作出判断总体分布形式未知,需对总体分布函数形式或总体之间的关系进行判断第Ⅰ类错误:弃真原假设为正确时拒绝原假设第Ⅰ类错误:弃真原假设为错误时未拒绝原假设第Ⅱ类错误:取伪犯第Ⅰ错误的概率是 α犯第Ⅱ错误的概率是 β现实的做法:对犯第Ⅰ错误的概率α加以控制第Ⅰ类错误:弃真α——显著性水平第Ⅱ类错误:取伪犯第Ⅰ错误的概率是 α犯第Ⅱ错误的概率是 β现实的做法:对犯第Ⅰ错误的概率α加以控制 尽量保证弃真错误控制在一定范围内的假设检验叫显著性检验。就是这个假设显著错误的时候,才丢弃,没有显著错误的假设就接受,显著错误的衡量标准就是发生概率低于显著水平。统计显著性 在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的。统计显著性 一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。小概率事件指在一次试验中几乎不会发生的事件。例如,只有0.01,即指平均每100次观察中只出现1次。以样本资料为依据进行检验,所以样本统计量的取得就相当于这样一次试验。而在取得样本的一次试验中,小概率一般是很难(或不可能)出现的。如果在原假设中小概率事件居然在取得样本的一次试验中发生了,则就有理由怀疑原来对该事件提出的假设的正确性,从而拒绝原假设成立。小概率值记为α,称为检验水平或显著性水平,一般取α=0.05(或0.01)。双侧检验的拒绝域H0临界值临界值a/2a/2拒绝H0拒绝H01 - 置信水平拒绝域非拒绝域拒绝域双侧检验的拒绝域H0临界值临界值a /2a /2样本统计量拒绝H0拒绝H01 - 置信水平双侧检验的拒绝域H0临界值临界值a /2a /2样本统计量拒绝H0拒绝H01 - 置信水平双侧检验的拒绝域H0临界值临界值a /2a /2样本统计量拒绝H0拒绝H01 - 置信水平单侧检验的拒绝域——左侧检验H0临界值a拒绝H01 - 置信水平样本统计量单侧检验的拒绝域——左侧检验H0临界值a样本统计量拒绝H01 - 置信水平单侧检验的拒绝域——右侧检验H0临界值a样本统计量拒绝H01 - 置信水平单侧检验的拒绝域——右侧检验H0临界值a样本统计量1 - 置信水平拒绝H0用P值进行决策 / 2 / 2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值用P值进行决策0临界值a样本统计量拒绝H01 - 置信水平计算出的样本统计量P 值用P值进行决策0临界值a拒绝H01 - 置信水平计算出的样本统计量P 值总体抽取随机样本均值 x = 20 我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策第七章 假设检验第七章 假设检验假定条件:正态总体或非正态总体大样本(n>30) 使用z检验统计量【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平 =0.05 ,检验该天生产的饮料容量是否符合标准要求?绿色健康饮品绿色健康饮品255255双侧检验H0 : = 255H1 : 255 = 0.05n = 40临界值(c):z01.96-1.960.025拒绝 H0拒绝 H00.025检验统计量:决策:结论:不拒绝H0(p=0.3125)样本提供的证据还不足以推翻“该天生产的饮料符合标准要求 ”的看法【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? ( =0.01)50个零件尺寸的误差数据 (mm) 1.26 1.19 1.31 0.97 1.811.13 0.96 1.06 1.00 0.940.98 1.10 1.12 1.03 1.161.12 1.12 0.95 1.02 1.131.23 0.74 1.50 0.50 0.590.99 1.45 1.24 1.01 2.031.98 1.97 0.91 1.22 1.061.11 1.54 1.08 1.10 1.641.70 2.37 1.38 1.60 1.261.17 1.12 1.23 0.82 0.86检验统计量:拒绝H0(p=0.004579)新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01H0 : 1.35H1 : <1.35 = 0.01n = 50临界值(c):假设 双侧检验 左侧检验 右侧检验假设形式 H0 :m =m0 H1 :m m0 H0 :m m0 H1 :m H1:m >m0统计量 已知 未知 拒绝域P值决策 拒绝H0 检验统计量假定条件: 总体服从正态分布 小样本(n<30)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度 (cm) 12.2 10.8 12.0 11.8 11.912.4 11.3 12.2 12.0 12.3H0 : =12H1 : 12 = 0.05df = 10 - 1= 9临界值(c):检验统计量:不拒绝H0(p=0.499538)样本提供的证据还不足以推翻“该供货商提供的零件符合要求 ”的看法决策:结论:t02.262-2.2620.025拒绝 H0拒绝 H00.025用置信区间进行检验 双侧检验1. 求出双侧检验均值的置信区间2. 若总体的假设值 0在置信区间外,拒绝H0用置信区间进行检验 左侧检验1. 求出置信区间2.若总体的假设值 0在置信区间外,拒绝H0用置信区间进行检验 右侧检验1. 求出置信区间2.若总体的假设值 0在置信区间外,拒绝H0【例】一种袋装食品每包的标准重量应为1000g。现从生产的一批产品中随机抽取16袋,测得其平均重量为991g。已知这种产品重量服从标准差为50g的正态分布。试确定这批产品的包装重量是否合格?( = 0.05)H0: = 1000H1: 1000 = 0.05n = 16临界值(s):Z01.96-1.96.025拒绝 H0拒绝 H0.025置信区间为决策:结论:假设的μ0 =1000在置信区间内,不拒绝H0没有证据表明这批产品的包装重量不合格 是否已知小样本容量n大 是否已知否t 检验否z 检验是z 检验是z 检验假定条件: 总体服从二项分布 可用正态分布来近似(大样本) 使用z检验统计量【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和 =0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?双侧检验H0 : = 80%H1 : 80% = 0.05n = 200临界值(c):检验统计量:拒绝H0 (p = 0.013328 < = 0.05)该杂志的说法并不属实决策:结论:z01.96-1.960.025拒绝 H0拒绝 H00.025H0 : = 80%H1 : 80% = 0.01n = 200临界值(c):检验统计量:不拒绝H0 (p = 0.013328 > = 0.01)样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法决策:结论:z02.58-2.580.005拒绝 H0拒绝 H00.005假定条件: 假设总体近似服从正态分布 使用 2检验统计量假设 双侧检验 左侧检验 右侧检验假设形式 H0 : 2= 02 H1: 2 0 H0 : 2 02 H1 : 2 < 02 H0 : 2 02H1: 2 > 02统计量 拒绝域P值决策 拒绝H0朝日BEER朝日BEER朝日BEER朝日【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求?H0 : 2 = 42H1 : 2 42 = 0.10df = 10 - 1 = 9临界值(s):统计量:不拒绝H0(p=0.9563)样本提供的证据还不足以推翻“装填量的标准差不符合要求”的看法 2016.91903.32511 /2 =0.05决策:结论:第七章 假设检验第七章 假设检验假定条件: 两个样本是独立的随机样本 正态总体或非正态总体大样本(n1 30和 n2 30) 检验统计量假设 双侧检验 左侧检验 右侧检验假设形式 H0 :m 1-m 2=0 H1 :m 1-m 2 0 H0 :m 1-m 2 0 H1 :m 1-m 2<0 H0 :m 1-m 2 0H1 :m 1-m 2>0统计量 12 , 22 已知 12 , 22 未知 拒绝域P值决策 拒绝H0【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?两个样本的有关数据 男性职员 女性职员n1=44 n2=32=75 =70=64 =42.25H0 : 1- 2 = 0H1 : 1- 2 0 = 0.05n1 = 44,n2 = 32临界值(c):检验统计量:决策:结论:拒绝H0(p=0.002682)该公司男女职员的平均小时工资之间存在显著差异z01.96-1.960.025拒绝 H0拒绝 H00.025 检验统计量假定条件: 两个样本是独立的小样本 两个总体都服从正态分布 检验统计量假定条件: 两个样本是独立的小样本 两个总体都服从正态分布 检验统计量假定条件: 两个样本是独立的小样本 两个总体都服从正态分布 样本容量相等,即n1=n2=n【例】为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需的时间(单位:min)下如表。假定两种方法组装产品的时间服从正态分布,但方差未知且不相等。取显著性水平0.05,能否认为方法1组装产品的平均时间明显地高于方法2?两个方法组装产品所需的时间 方法1 方法2 28.3 36.0 27.6 31.730.1 37.2 22.2 26.029.0 38.5 31.0 32.037.6 34.4 33.8 31.232.1 28.0 20.0 33.428.8 30.0 30.2 26.521H0 : 1- 2 <= 0H1 : 1- 2 > 0 = 0.05n1 =n2 = 12检验统计量:决策:结论:给定显著性水平0.05,t0.05(22)=1.717,t=2.156>t0.05(22),落入拒绝域,因此拒绝H0方法1组装产品的平均时间明显地高于方法2=(32.5-28.8)/((15.996+19.358)/12)^2=2.1556S12=15.996S22=19.358假定条件: 两个总体都服从二项分布 可以使用正态分布来近似 检验统计量假设 双侧检验 左侧检验 右侧检验假设形式 H0 : 1- 2=0 H1 : 1- 2 0 H0 : 1- 2 0 H1 : 1- 2<0 H0 : 1- 2 0H1 : 1- 2>0统计量 拒绝域P值决策 拒绝H0【例】一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法是否存在差异,分别抽取了200名男学生和200名女学生进行调查,其中的一个问题是:“你是否赞成采取上网收费的措施?”其中男学生表示赞成的比例为27%,女学生表示赞成的比例为35%。调查者认为,男学生中表示赞成的比例显著低于女学生。取显著性水平 =0.05,样本提供的证据是否支持调查者的看法?21netnetH0 : 1- 2 0H1 : 1- 2 < 0 = 0.05n1=200 , n2=200临界值(c):检验统计量:决策:结论:拒绝H0(p= 0.041837 < = 0.05)样本提供的证据支持调查者的看法-1.645Z0拒绝域 假定条件: 两个总体都服从正态分布,且方差相等 两个总体相互独立 检验统计量FF1- F 拒绝H0方差比F检验示意图拒绝H0假设 双侧检验 左侧检验 右侧检验假设形式 H0: 12/ 22=1 H1 : 12/ 22 1 H0: 12/ 22 1 H1 : 12/ 22<1 H0 : 12/ 22 1H1 : 12/ 22>1统计量 拒绝域 P值决策 拒绝H0【例】一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大,价格也很相近,考虑的主要因素就是灯泡使用寿命的方差大小。如果方差相同,就选择距离较近的一家供货商进货。为此,公司管理人员对两家供货商提供的样品进行了检测,得到的数据如右表。检验两家供货商灯泡使用寿命的方差是否有显著差异 ( =0.05)两家供货商灯泡使用寿命数据 样本1 650 569 622 630 596637 628 706 617 624563 580 711 480 688723 651 569 709 632样本2 568 540 596 555496 646 607 562589 636 529 584681 539 617解:根据题意可知,本题属于两个总体方差的检验问题,关心的是两个厂家灯泡使用寿命是否有差异。可见,属于双侧检验问题,原假设和备择假设为H0: 12/ 22=1,H1 : 12/ 22 1由题意知,样本容量n1=20 , n2=15,样本方差S12=3675.461 ,S22=2431.429 ,于是构造F统计量:=3675.461 /2431.429 =1.5116在显著性水平0.05下,左临界值F0.975(19,14)=0.377796 ,右临界值F0.025(19,14)=2.860722 。落入接受域,不能拒绝原假设,故认为两家生产的灯泡使用寿命没有显著差异。参数检验的Excel应用上机内容 展开更多...... 收起↑ 资源预览