资源简介 (共29张PPT)“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第十章回归分析第二节 一元线性回归二、参数的最小二乘估计四、利用回归方程进行预测一、一元线性回归模型三、回归方程的显著性检验五、小结一、一元线性回归模型随机变量 Y可控变量 X线性相关Y 关于 X 的 一 元线性回归模型:n 次独立观测数据a, b 为待估计的模型参数. εi为随机误差项.一、一元线性回归模型当 时, ,可得对每个 ,相应的因变量的观测值 来自于正态总体 ,回归直线将穿过点 , 即回归直线从Y 的均值位置穿过.理论回归方程:二、参数的最小二乘估计假设a, b 的估计量为拟合误差(残差)一个比较好的回归方程应该使所有观测点的残差平方和尽可能小二、参数的最小二乘估计残差平方和:二元函数 的最小值点称为 a,b 的最小二乘估计.求 关于 的偏导数,并令其等于0,列方程组如下:二、参数的最小二乘估计进一步整理得:其中当 不全相等时,方程组的系数矩阵的行列式二、参数的最小二乘估计解得唯一解:经验回归方程:其中注:经验回归直线一定过观测数据散点图的几何中心例10.2.1 由专业知识可知,合金钢的强度 Y(107 Pa)与合金钢中碳的含量X (%)有关.为了研究它们之间的关系,从生产中收集了一批数据,如下表所列.试根据这些数据求 Y 关于 X 的经验回归方程.序号 x y 序号 x y1 0.10 42.0 7 0.16 49.02 0.11 43.5 8 0.17 53.03 0.12 45.0 9 0.18 50.04 0.13 45.5 10 0.20 55.05 0.14 45.0 11 0.21 55.06 0.15 47.5 12 0.23 60.0解先根据已知数据绘制 X 和 Y 的散点图解由散点图可知,12个观测数据点分布在一条直线附近, Y 与 X 是线性相关的.假定 Y 关于 X 的理论回归方程为经计算得从而可得故 Y 关于 X 的经验回归方程为三、回归方程的显著性检验对于变量 Y 和 X 的任意 n对观测值,只要不全相等,则无论变量 Y 和 X 之间是否存在线性相关关系,都可根据上面介绍的方法求得一个线性回归方程。显然,只有当变量 Y 和 X 之间存在线性相关关系时,这样的线性回归方程才是有意义的.为了使求得的线性回归方程真正有意义, 就需要检验变量 Y 和 X 之间是否存在显著的线性相关关系.三、回归方程的显著性检验1. F 检验离差分解:三、回归方程的显著性检验1. F 检验残差平方和回归平方和三、回归方程的显著性检验1. F 检验定理10.2.1 对于一 元线性回归,有并且 和 相互独立H0成立时,三、回归方程的显著性检验1. F 检验检验统计量拒绝域aF (1,n-2)0拒绝H0不能拒绝H0FF 分布三、回归方程的显著性检验1. F 检验当 时拒绝原假设H0,认为 Y 和 X 之间的线性相关关系是显著的.方差来源 平方和 自由度 均方 F值 临界值回归 SSR 1 MSR = SSR / 1 MSR / MSE Fα(1,n–2)残差 SSE n –2 MSE = SSE /(n–2)总和 SST n –1一元线性回归的方差分析表:例10.2.2 在研究合金钢的强度(Y)与碳含量(X)关系的例10.2.1中,我们已经求出了 Y 关于 X 的经验回归方程,接下来取显著性水平 α = 0.01,对回归方程进行显著性检验.解经计算得从而可得解SST, SSR, SSE 的自由度分别为11, 1和10,从而可得各均方分别为检验统计量的观测值由于检验统计量可得检验的 p 值为解由上表可知两不等式均可说明在显著性水平0.01下,Y 和 X 之间的线性相关关系是显著的,或者说 Y 关于X 的回归方程是显著的.又 F(1,10)分布的上侧0.01分位数 ,于是可得方差分析表如下:方差来源 平方和 自由度 均方 F 值 临界值 p 值回 归 317.2587 1 317.2587 176.5393 10.04 0.0000残 差 17.9705 10 1.7971 总 计 335.2292 11 三、回归方程的显著性检验2. t 检验定理10.2.2 对于一 元线性回归,有并且 和 相互独立(1) 的分布并且 和 相互独立2. t 检验当原假设 成立时,检验统计量(2) 检验统计量和拒绝域拒绝域检验的 p 值其中 称为剩余标准差(或均方根误差)故在显著性水平0.01下拒绝原假设H0,认为Y 关于 X 的回归方程是显著的以例10.2.1中数据为例,经计算得注:对于一元线性回归分析,t 检验和F 检验是等同的四、利用回归方程进行预测1. 点预测称 为 y0 的点预测.对于给定的 X = x0,由于因变量 Y 是随机变量, Y 的相应取值 y0 是无法准确预测的.将 x0 代入经验回归方程,只能得到 y0 的均值的估计四、回归系数的显著性检验2. 区间预测对于给定的 X = x0,相应的y0 的均值 a+bx0 的点估计为由 可得 y0 的置信水平为 1-α 的预测区间为其中四、回归系数的显著性检验2. 区间预测当 时, y0 的预测区间的长度达到最短当 x0 逐渐远离 时,预测区间的长度逐渐增大例10.2.3 在例10.2.1中,若碳含量为0.19,求相应的合金钢强度的预测值和置信水平为95%的预测区间.解令 ,可得合金钢强度 y0 的预测值为取 ,则 ,又可得从而可得所求预测区间为小结1. 主要概念:一元线性回归模型,理论回归方程,经验回归方程.2. 参数的最小二乘估计.3. 回归方程的显著性检验:F 检验和 t 检验.4. 利用回归方程进行预测:点预测和区间预测. 展开更多...... 收起↑ 资源预览