资源简介 (共70张PPT)应用统计学Applied Statistics第01章 绪论第02章 统计数据的收集第03章 统计数据的整理第04章 描述性统计第05章 抽样第06章 参数估计第07章 假设检验第08章 方差分析第09章 时间序列分析第10章 统计指数第11章 相关回归分析授课内容第八章 方差分析第八章 方差分析第八章 方差分析第八章 方差分析第八章 方差分析 检验两个总体均值μ1,μ2是否相等时,常采用t检验法。而讨论两个以上总体均值是否相等时的假设检验问题所用的方法是方差分析。方差分析 方差分析是数理统计中最常用的基本方法之一,是工农业生产和科学研究中分析数据的一种重要方法。其基本思路是将一组数据的总离差平方和分解为若干有意义的平方和,然后通过比较这些平方和的大小来判断总体均值μ1,μ2,μ3,…,μn相等这一假设是否成立的一种检验方法。方差分析进行方差分析,需要进行试验,在试验中,通常将需要考察的指标称为试验指标。 试验与试验指标 因素与水平 单因素试验与单因素方差分析 多因素试验与多因素方差分析 等重复试验与不等重复试验影响试验指标的条件称为因素,通常用A、B、C表示。将因素所处的不同状态称为水平,例如因素A有r个不同水平则用A1,A2,…,Ar表示,因素B有s个不同水平则用B1,B2,...,Bs表示。在一项试验中如果只有一个因素在变动,则称为单因素试验,处理单因素试验的统计推断方法叫单因素方差分析。 试验与试验指标 因素与水平 单因素试验与单因素方差分析 多因素试验与多因素方差分析 等重复试验与不等重复试验如果多于一个因素在改变,则称为多因素试验,处理多于一个因素试验的统计推断方法叫多因素方差分析。若在各种水平下所作的试验次数都相同,则称为等重复试验,否则称为不等重复试验。 试验与试验指标 因素与水平 单因素试验与单因素方差分析 多因素试验与多因素方差分析 等重复试验与不等重复试验【例】某计算机产品公司在北京、上海、广州三地设有分厂。为确定这些分厂有多少员工了解全面质量管理,公司特从每个分厂中选取由6名员工组成的随机样本,并对他们进行质量意识考核。18名员工的考试成绩列于下表中,每一组的样本均值、样本方差及样本标准差均已给出。管理者想利用这些数据来检验假设:三个分厂的平均考分相同。 18个员工的考试分数 试验号 北京分厂(1) 上海分厂(2) 广州分厂(3)1 85 71 592 75 75 643 82 73 624 76 74 695 71 69 756 85 82 67样本均值 79 74 66样本方差 34 20 32样本标准差 5.83 4.47 5.66这是一个典型的单因素三水平等重复试验,其中考分是试验指标,地点是唯一影响因素,三个分厂的位置就称为三个水平,现在假定总体1为北京分厂的全体员工,总体2为上海分厂的全体员工,总体3为广州分厂的全面员工。令:μ1=总体1的平均考分μ2=总体2的平均考分μ3=总体3的平均考分H0:μ1=μ2=μ3H1:μ1,μ2,μ3不全相等如果检验结果发现三个样本均值的差异足够大,这时就有理由拒绝原假设,接受备择假设,即认为三个分厂的平均考分不相同,也就是说三个分厂的全面质量管理效果不一样。进行方差分析需要满足以下三个假定: 观测值是相互独立的 各个总体的方差必须相同 每个总体都应服从正态分布 两类误差组内平方和组间平方和 若k个总体均值相等,即原假设H0: μ1=μ2=…=μk不存在系统误差,组内平方和与组间平方和的差别不大。第八章 方差分析第八章 方差分析 数学模型设因素A有r个不同水平A1,A2,A3,…,Ar,在每个水平Aj(j=1,2,3,…,r)下,进行nj(nj>=2)次独立试验,得到下表结果: A1 A2 … Aj ... Ar1 y11 y12 … y1j … y1r2 y21 y22 … y2j … y2r… … … … … … …nj … …样本总和 T.1 T.2 … T.j … T.r样本均值 … … 总体均值 μ1 μ2 … μj … μr水平试验号假定:各个水平Aj(j=1,2,…,r)下的样本y1j,y2j,…,ynjj,来自具有相同方差σ2,均值分别为μj(j=1,2,…,r)的正态总体N(μj,σ2),μj与σ2未知,且设不同水平Aj下的样本之间相互独立。由于yij~N(μj,σ2),即有yij-μj ~ N(0,σ2),故yij-μj可看作随机误差,记yij-μj=εij,则可得到单因素方差分析的数学模型:其中μj,σ2均为未知参数 数学模型 提出假设方差分析的任务就是对于上述数学模型,检验r个总体N(μ1,σ2),…,N(μr,σ2)的均值是否相等即检验假设:H0:μ1=μ2=…=μrH1: μ1,μ2,…,μr不全相等 平方和的分解设总离差平方和为ST2,它可分解为:SE2SA2 平方和的分解SE2 表示在水平Aj下,样本观察值与样本均值的差异是由随机误差引起的,故称误差平方和,又称组内离差平方和。SA2 表示水平Aj水平的样本均值与样本总均值的差异,是由水平Aj以及随机误差引起的,它反映了各水平之间的观测值差异(也包括误差),称为效应平方和。也称组间离差平方和。 平方和的分解 总离差平方和ST2是试验的总误差,反映数据波动的程度;组内平方和SE2是由随机误差引起的,反映随机误差;组间平方和SA2是各水平下样本均值与总体均值之间的差异,反映由因素A的水平变动而产生的误差,即系统误差。 平方和的分解 方差分析的实质就是要将总误差中的随机误差和系统误差加以分离,并将二者在一定条件下加以比较,如差异不大则认为系统误差对指标的影响不大;如系统误差较随机误差大得多,则说明所考察条件的影响很大。 平方和的分解 检验统计量及其分布定理1 在单因素方差分析数学模型中:(1)SE2/σ2~X2(n-r);(2)当H0成立时,SA2/σ2~X2(r-1),且SE2与SA2相互独立。根据随机变量F分布的定义,若随机变量则:,,综合定理1,则当H0成立时,有:令: 检验统计量及其分布 假设检验问题的拒绝域定理2 在单因素方差分析数学模型中:则有:当H0成立时,当H0不成立时,也就是说,当H0不成立时MSA/MSE有大于1的趋势,因此,在显著性水平α下,其拒绝域为: 假设检验问题的拒绝域单因素方差分析表 方差来源 平方和 自由度 均方 F值因素A SA2 r-1 MSA F=MSA/MSE误差E SE2 n-r MSE 总和T ST2 n-1 第八章 方差分析第八章 方差分析 双因素方差分析,不但要考虑因素A、B单独对试验指标的影响是否显著,还要考察这两个因素联合起来对试验指标的影响是否显著。这种作用叫做A、B这两个因素的交互作用。交互作用只存在于等重复试验中,因为在双因素方差分析中,只有当在每个因素的不同水平上进行等重复试验时,才能分析出两因素之间是否存在交互作用。双因素方差分析 设在某项试验中,有两个因素A和B在变化,因素A有r个不同水平A1,A2,A3,…,Ar;因素B有s个不同水平则用B1,B2,...,Bs。现对因素A,B各水平下的每对组合(Ai,Bj)(i=1,2,…,r;j=1,2,…,s)都作t(t>=2)次独立重复试验,称为双因素多水平等重复试验,下表是双因素多水平等重复试验的试验结果: B1 B2 ... BsA1 x111,x112,…,x11t x121,x122,…,x12t … x1s1,x1s2,…,x1stA2 x211,x212,…,x21t x221,x222,…,x22t … x2s1,x2s2,…,x2st… … … … …Ar xr11,xr12,…,xr1t xr21,xr22,…,xr2t … xrs1,xrs2,…,xrst 确定假设:H01:α1=α2=…=αr=0H02:β1=β2=…=βs=0H03:γ11=γ12=…=γrs=0(γij=0,i=1,2,…,r;j=1,2,…,s) 要检验因素A对试验指标的影响是否显著,就要对H01作显著性检验;要检验因素B对试验指标的影响是否显著,就要对H02作显著性检验,要检验因素A、B交互作用对试验指标的影响是否显著,就要对H03作显著性检验。 平方和的分解:ST2=SE2+SA2+SB2+SA*B2 检验统计量及其分布定理3 在双因素等重复方差分析数学模型中(1)SE2/σ2~X2(rs(t-1));(2)当H01成立时,SA2/σ2~X2(r-1);(3)当H02成立时,SB2/σ2~X2(s-1);(4)当H03成立时,SA*B2/σ2~X2((r-1)(s-1));(5)SE2,SA2,SB2,SA*B2相互独立. 检验统计量及其分布则当H01成立时,有:当H02成立时,有:当H03成立时,有: 假设检验问题的拒绝域 对于给定的显著性水平,原假设H01的拒绝域为: 对于给定的显著性水平,原假设H02的拒绝域为: 对于给定的显著性水平,原假设H03的拒绝域为:双因素等重复方差分析计算表 方差来源 平方和 自由度 均方 F值 临界值因素A SA2 r-1 MSA MSA/MSE 因素B SB2 s-1 MSB MSB/MAE A*B SA*B2 (s-1)(r-1) MSAB MSAB/MSE 误差E SE2 rs(t-1) MSE 总和T ST2 rst-1 双因素等重复方差分析计算表 方差来源 平方和 自由度 均方 F值 临界值因素A SA2 r-1 MSA MSA/MSE 因素B SB2 s-1 MSB MSB/MAE A*B SA*B2 (s-1)(r-1) MSAB MSAB/MSE 误差E SE2 rs(t-1) MSE 总和T ST2 rst-1 所谓双因素无重复问题,就是对因素A,B的每一对组合(Ai,Bj)只做一次试验。所得结果如下表: B1 B2 ... BsA1 X11 X12 … X1sA2 X21 X22 … X2s… … … … …Ar Xr1 Xr2 … Xrs 提出假设H01:α1=α2=…=αr=0H02:β1=β2=…=βs=0 要检验因素A对试验指标的影响是否显著,就要对H01作显著性检验;要检验因素B对试验指标的影响是否显著,就要对H02作显著性检验。 平方和的分解ST2=SE2+SA2+SB2 检验统计量及其分布定理 在双因素无重复方差分析数学模型中(1)SE2/σ2~X2((r-1)(s-1));(2)当H01成立时,SA2/σ2~X2(r-1);(3)当H02成立时,SB2/σ2~X2(s-1);(4)SE2,SA2,SB2相互独立. 检验统计量及其分布则当H01成立时,有:当H02成立时,有: 假设检验问题的拒绝域对于给定的显著性水平,原假设H01的拒绝域为:对于给定的显著性水平,原假设H02的拒绝域为:双因素无重复方差分析计算表 方差来源 平方和 自由度 均方 F值 临界值因素A SA2 r-1 MSA MSA/MSE 因素B SB2 s-1 MSB MSB/MAE 误差E SE2 (r-1)(s-1) MSE 总和T ST2 rs-1 双因素无重复方差分析计算表 方差来源 平方和 自由度 均方 F值 临界值因素A SA2 r-1 MSA MSA/MSE 因素B SB2 s-1 MSB MSB/MAE 误差E SE2 (r-1)(s-1) MSE 总和T ST2 rs-1 展开更多...... 收起↑ 资源预览