资源简介 (共50张PPT)管理统计学4 假设检验4.1 假设检验的基本原理4.2 参数假设检验4.3 非参数假设检验4.1 假设检验的基本原理4.1.1 假设检验的定义4.1.2 假设检验的分类4.1.3 假设检验的思想方法4.1.4 原假设和备择假设4.1.5 假设的两类错误分析4.1.6 总体参数检验的步骤和方法4.1.1 假设检验的定义统计假设:关于总体的分布以及分布中所含参数的各种论断对随机现象的实际观察对随机现象的理论分析假设检验:施加于一个或多个总体的概率分布或参数的假设假设总体分布的形式或总体的参数有某种特征判断原先的假设是否合理合理:承认假设的正确性不合理:否定原先的假设对问题作出分析或推断4.1.2 假设检验的分类假设检验包括:参数假设检验和非参数假设检验参数假设检验:X1,X2,…,Xn是来自分布形式已知、参数未知总体的样本,由其观测值检验假设H0: = 0; H1: ≠ 0, 为已知实数非参数假设检验: X1,X2,…,Xn是来自分布形式未知总体的样本,由其观测值检验假设H0:F(x)=F0(x, ); H1: F(x) ≠F0(x, ), F0(x, )为已知分布函数4.1.3 假设检验的基本原理假设检验的基本思想提出统计假设,根据小概率原理对其进行检验实际推断原理/小概率原理小概率事件 :在某次试验或观测中,出现的概率很小的事件小概率事件在一次试验中几乎不会发生小概率事件发生,否定原来的假设4.1.4 原假设和备择假设假设检验的三种形式左尾检验、右尾检验和双尾检验H0为原假设,H1为备择假设原假设与备择假设的确定若想支持某种假设,把它作为备择假设,把该陈述的否定假设作为原假设两种假设互斥且完备,接受H0 ,必须拒绝H1一个特定形式的H1不只与唯一的H0相对4.1.5 假设的两类错误分析两类错误的对比情况表 为拒真概率, 为存伪概率,1 为检验功效控制第一类型错误较为实际,即只分析原假设H0,这样的假设为显著性检验, 为显著性水平接受 拒绝H0真实 正确的决定(1 ) 第一类型错误( )H0不真实 第二类型错误( ) 正确的决定(1 )两类错误对比情况表4.1.6 总体参数检验的步骤(1)提出假设根据检验目标,对待推断的总体参数或分布提出一个基本假设(2)决定检验的显著性水平α由被检验的统计量分布求出相应的临界值该临界值为零假设的拒绝域和接受域的分界线(3)构造检验统计量,依据样本信息计算检验统计量的实际值(4)将实际求得的检验统计量取值与临界值进行比较,作出拒绝或接受零假设的决策p<α,拒绝零假设p>α,不应拒绝零假设4.2 参数假设检验4.2.1 一个正态总体参数假设检验4.2.2 一个正态总体参数假设检验的SPSS应用4.2.3 两个正态总体参数假设检验4.2.4 两个正态总体参数假设检验的SPSS应用4.2.1 一个正态总体参数假设检验已知方差 2,检验假设 = 0未知方差 2,检验假设 = 0未知方差 2,检验假设 > 0已知方差 2,检验假设 = 0提出零假设H0确定统计量Z已知其分布和参数统计量的值可以计算计算统计量Z值给出显著性水平 ,做出决策︱Z︱>Z /2,拒绝H0未知方差 2,检验假设 = 0提出零假设H0确定统计量T已知其分布和参数统计量的值可以计算计算统计量T值给出显著性水平 ,做出决策︱T︱>T /2,拒绝H0未知方差 2,检验假设 > 0为未知方差 2,检验假设: = 0的特殊情况可由题意及统计量T的构成,确定T >0,仅考虑T ≥Tα/2的情况例4.1 样品直径均值检验测得一批零件的20个样品的直径(单位:cm)假设直径服从正态分布,样本的均值与总体均值显著差别总体均值为5.20对样本的数据进行均值检验4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.205.46 5.27 5.23 4.96 5.35 5.15 5.35 4.77 5.33 5.54One-Sample T Test对话框Analyze→Compare means→One-Samples T test:{One-Sample T Test}在Test Value框中输入检验值Test 列表框用于输入总体均值One-Sample T Test: Options对话框置信度:[50,99],默认值95缺失值的处理方式剔除计算时涉及变量含有缺失值的case剔除在任意变量上含有缺失值的caseOne-Sample T Test输出结果One-Sample StatisticsN Mean Std. Deviation Std. Error Mean直径 20 5.2075 .21851 .04886单样本数据的统计表数据个数均值标准离差均值的标准误差One-Sample TestTest Value = 5.2t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the DifferenceLower Upper直径 .153 19 .880 .00750 -.0948 .1098总体均值T统计量值自由度双尾显著性概率均值差:样本均值与总体均值之间的差值均值差的95%置信区间4.2.3 两个正态总体下的参数假设检验未知未知两个总体的均值 1、 2,检验假设H0:总体方差未知两个总体的均值 1、 2,检验假设H0:总体方差未知两个总体的方差 , 已知 ,检验假设H0: 1= 2未知两个总体的方差 , 已知 ,检验假设H0: 1= 2未知总体均值 1和 2 ,检验H0:统计量 服从F(n-1,m-1)分布计算统计量F值,与Fα/2和F1- α/2比较,做出决策未知总体均值 1和 2 ,检验H0:统计量 服从F(n-1,m-1)分布计算统计量F值,与Fα比较,做出决策未知总体方差 ,已知检验H0: 1= 2统计量 服从t(m+n-2),n为来自总体X的样本数,m为来自总体Y的样本数计算统计量F值,︱t︱≥t α/2,拒绝H0︱t︱<t α/2 ,接受H0未知总体方差 ,已知检验H0: 1= 2统计量检验过程同未知两个总体的方差 , 已知 ,检验假设H0: 1= 2 的检验例4.2 独立样本的t检验某企业统计了两种不同的膨化食品A和B分别在八家不同超市的日销量(箱)检验两种膨化食品的日销量是否有显著差异食品A 86 87 56 93 84 93 75 79食品B 80 79 58 91 77 82 76 66Independent-Sample T Test对话框Analyze→Compare Means→Independent-Samples T Test...Test 列表框分类变量Define Groups对话框不同变量值对应的数据将被用作检验对象分别将大于等于与小于窗口中数值的数据作为两组进行t检验One-Sample T Test: Options对话框置信度:[50,99],默认值95缺失值的处理方式剔除计算时涉及变量含有缺失值的case剔除在任意变量上含有缺失值的caseGroup Statistics输出表Group Statistics食品种类 N Mean Std. Deviation Std. Error Mean日销量 1 8 81.6250 12.07048 4.267562 8 76.1250 10.07738 3.56289分组统计表数据个数均值标准离差均值的标准误差Independent Samples T Test输出表Levene's Test for Equality of Variances t-test for Equality of MeansF Sig. t df Sig. (2-tailed)产量 Equal variances assumed .205 .657 .989 14 .339Equal variances not assumed .989 13.568 .340Mean Difference Std. Error Difference 95% Confidence Interval of the Difference产量 Lower UpperEqual variances assumed .205 .657 5.5000 5.55934 -6.42360 17.42360Equal variances not assumed 5.5000 5.55934 -6.45935 17.45935方差齐性方差非齐性方差非齐性检验等均值t检验均值差异标准误差例4.3 环境对液态产品的影响检验不同压力环境A和B下的某液态产品的浓度数据检验不同环境对该液态产品的浓度是否有显著影响(零假设为没有显著影响)环境A 62.5 65.2 67.6 69.9 69.4 70.1 67.8 67.0 68.5 62.4环境B 51.7 54.2 53.3 57.0 56.4 61.5 57.2 56.2 58.4 55.8Paired-Samples T Test对话框Analyze→Compare Means→Paired-Samples T Test…Test 列表框配对变量Paired-Samples T Test输出结果Paired Samples StatisticsMean N Std. Deviation Std. Error MeanPair 1 压力A 67.040 10 2.8218 .8923压力B 56.170 10 2.7370 .8655Paired Samples TestPaired Differences t df Sig. (2-tailed)Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the DifferenceLower UpperPair1 压力A- 压力B 10.87 2.2236 .7032 9.279 12.461 15.458 9 .000配对样本统计表配对样本t检验4.3 非参数假设检验4.3.1 符号检验法:通过两个相关样本的每对数据之差的符号进行检验,比较两个样本的显著性配对资料的符号检验样本中位数与总体中位数比较的符号检验4.3.2 秩和检验法:一种用样本秩来代替样本值的检验法,可用于检验两个总体的分布函数是否相等的问题配对试验资料符号秩和检验非配对试验资料符号秩和检验4.3.3 非参数假设检验的SPSS应用卡方检验柯尔莫哥洛夫-斯米诺夫检验配对资料的符号检验提出无效假设与备择假设H0:甲、乙两个处理差值d总体中位数= 0H1:甲、乙两个处理差值d总体中位数≠0进行单尾检验,把“≠”换成“<”或者“>”计算差值并赋予符号d>0,记为“+”, “+”个数记为n+d<0,记为“-”, “-”个数记为n-d=0,记为“0”, “0”个数记为n0统计量K = min{ n+ , n- }统计推断令n = n++n-K>K0.05(n),P>0.05,不能否定H0,两个处理差异不显著K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著K≤K0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著提出无效假设与备择假设H0:样本所在的中位数= 已知总体的中位数H1:样本所在的中位数≠已知总体的中位数进行单尾检验,把“≠”换成“<”或者“>”计算差值,确定符号及其个数样本各观测值中大于已知总体中位数的,记为“+”, “+”个数记为n+样本各观测值中小于已知总体中位数的,记为“-”, “-”个数记为n-样本各观测值中等于已知总体中位数的,记为“0”, “0”个数记为n0统计量K = min{ n+ ,n- }统计推断令n = n++n-K>K0.05(n),P>0.05,不能否定H0,样本中位数与已知总体中位数差异不显著K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,样本中位数与已知总体中位数差异差异显著K≤K0.01(n),P≤0.01,否定H0,接受H1,样本中位数与已知总体中位数差异差异极显著样本与总体中位数比较的符号检验配对试验资料符号秩和检验提出无效假设与备择假设H0:差值d总体中位数= 0H1:差值d总体中位数≠0进行单尾检验,把“≠”换成“<”或者“>”编秩次,定符号求配对数据的差值d按d的绝对值从小到大编秩次根据原差值正负,在各秩次前标正负号d=0,舍去不记d的绝对值相等,取其平均秩次确定统计量TT为正秩次及负秩次和中绝对值较小者统计推断令正负差值的总个数为nT>T0.05(n),P>0.05,不能否定H0,两个处理差异不显著T0.01(n)<T≤T0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著T≤T0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著非配对试验资料符号秩和检验提出无效假设与备择假设H0:甲样本所在的总体中位数=乙样本所在的总体中位数H1:甲样本所在的总体中位数≠乙样本所在的总体中位数进行单尾检验,把“≠”换成“<”或者“>”求两个样本合并数据的秩次两个样本的含量为n1和n2,合并后为n1+ n2合并后的数据按从小到大的顺序排列,序号即为数据的秩次不同样本的观测值相同,取原秩次的平均秩次同一样本的观测值相同,不必改动确定统计量T秩和较小的样本含量记为n1,秩和为T统计量统计推断T在T0.05(n1) - T0.05(n2–n1)之内 ,P>0.05,不能否定H0,两个处理差异不显著T在T0.05(n1) - T0.05(n2–n1)之内外,在T0.01(n1) - T0.01(n2–n1) 之内,0.01<P≤0.05,否定H0,接受H1,两个处理差异差异显著T在T0.01(n1) - T0.01(n2–n1) 之外,P≤0.01,否定H0,接受H1,两个处理差异差异极显著非参数假设检验方法Analyze→Nonparametric Tests非参数假设检验卡方检验二项检验游程检验K-S检验两个独立样本的检验多个独立样本的检验两个相关样本的检验多个相关样本的检验4.3.3 非参数假设检验中的SPSS应用卡方检验属于拟合优度检验适用于具有明显分类特征的数据检验某一类别的对象或反应的case数与根据零假设所得期望数是否有显著差异柯尔莫哥洛夫-斯米诺夫检验拟合优度型检验检验样本数据是否服从指定的理论分布设F0(x)是己知分布函数设Fn(x)是未知总体分布函数F(x)的一个较优估计取检验统计量D=max|Fn(x)-F0(x)|样本数据服从指定分布(即F(x)=F0(x))时,D的观测值应该较小若D的观测值较大,零假设可能不成立一次观测中某厂家6条生产线每小时生产的产量该厂家不同生产线的生产能力有无显著性差异?例4.4 生产能力差异性检验生产线A 生产线B 生产线C 生产线D 生产线E 生产线F20 46 33 35 42 40Test 列表框数据范围取得全部数据自定义数据各组数据的期望值相等自定义期望值Chi-Square对话框Exact Test与Options对话框采用逼近方法计算显著性水平,适用于大样本采用蒙特卡洛法计算显著性水平最大迭代次数:[1,1000000000]计算时间限制统计量描述显示描述性统计量显示四分位数缺失值的处理方式卡方检验输出结果生产线Observed N Expected N Residual生产线A 20 36.0 -16.0生产线B 46 36.0 10.0生产线C 33 36.0 -3.0生产线D 35 36.0 -1.0生产线E 42 36.0 6.0生产线F 40 36.0 4.0Total 216Test Statistics生产线Chi-Square 11.611adf 5Asymp. Sig. .041a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 36.0.对生产能力的统计检验结果例4.5 超市客流量情况分析某连锁超市在某广场的入口处观察每分钟通过的人数拟考察该广场的人流情况后,再做入超市购物分析和盈利评估观测2000余次人数/分钟 0 1 2 3 4 5 6 7 8 9 10观测到人数的次数(频次) 53 192 355 527 534 413 273 139 45 27 16One-Sample Kolmogorov-Smirnov Test对话框Test 列表框样本数据分布形式正态分布均匀分布泊松分布指数分布One-Sample Kolmogorov-Smirnov Test假设为正态分布检验结果One-Sample Kolmogorov-Smirnov Test每分人数N 2574Normal Parametersa Mean 3.9075Std. Deviation 1.89380Most Extreme Differences Absolute .126Positive .126Negative -.083Kolmogorov-Smirnov Z 6.384Asymp. Sig. (2-tailed) .000a. Test distribution is Normal.显著性p<0.01,样本与正态分布有显著差异One-Sample Kolmogorov-Smirnov Test假设为均匀分布检验结果One-Sample Kolmogorov-Smirnov Test 2每分人数N 2574Uniform Parametersa Minimum .00Maximum 10.00Most Extreme Differences Absolute .312Positive .312Negative -.105Kolmogorov-Smirnov Z 15.820Asymp. Sig. (2-tailed) .000a. Test distribution is Uniform.显著性p<0.01,样本与均匀分布有显著差异One-Sample Kolmogorov-Smirnov Test假设为泊松分布检验结果One-Sample Kolmogorov-Smirnov Test 3每分人数N 2574Poisson Parametera Mean 3.9075Most Extreme Differences Absolute .019Positive .013Negative -.019Kolmogorov-Smirnov Z .957Asymp. Sig. (2-tailed) .319a. Test distribution is Poisson.显著性p>0.05,样本服从泊松分布One-Sample Kolmogorov-Smirnov Test假设为指数分布检验结果One-Sample Kolmogorov-Smirnov Test4每分人数N 2574aExponential parameter.b Mean 3.9897Most Extreme Differences Absolute .297Positive .159Negative -.297Kolmogorov-Smirnov Z 14.916Asymp. Sig. (2-tailed) .000a. There are 53 values outside the specified distribution range. These values are skipped.b. Test Distribution is Exponential.显著性p<0.01,样本与指数分布有显著差异 展开更多...... 收起↑ 资源预览