资源简介 (共22张PPT)相关和回归分析2134线性回归分析线性相关分析直线回归分析的应用课程内容课程引入在水环境监测中,水质指标的浓度通常不能直接测定,而需要借助其与易测定值间的线性关系推算出。在分析污染来源时,需要分析水质指标的浓度间是否有相关性,如:河流中氨氮的含量与COD的含量是否相关?依此判断二者污染来源是否相同。这些问题需要通过相关分析和回归分析来解决。1.线性相关分析相关分析是对变量之间线性关系的描述与度量。目的是通过图形和数值揭示两种事物间的统计关系的强弱程度。相关分析步骤为:绘制散点图求相关系数;对相关系数进行统计检验。1.1 散点图a-正线性相关: 一个变量增加或减少时,另一个变量也相应增加或减少;b-负线性相关: 一个变量增加或减少时,另一个变量却减少或增加;c-非线性相关:变量之间的关系近似地表现为一条曲线;d-无相关:说明两个变量是独立的,即由一个变量值,无法预测另一个变量值。两变量实验数据有n组:(x1, y1); (x2, y2); ┄ (xi, yi)┄ (xn, yn);把这些数据以点的形式在直角坐标平面中显示即是散点图。右图所示两变量的关系总趋势有下列四种情况。1.2 相关系数相关系数是衡量两个变量之间线性相关程度的指标, 符号为r,其值在[-1,+1]之间。最常用的相关系数是皮尔逊(Pearson)相关系数,计算公式为:平均值实测值相关系数 r 与相关程度如下:r = 0;无线性关系;r = ±1 ,完全线性相关;0 < | r | < 1时,大於某临界值时,线性相关性显著。相关系数 r 与相关程度x通常采用英国统计学家戈赛特(Goset)以student笔名提出的t检验法,是对相关系数进行t抽样分布和假设检验,步骤如下:计算t值,公式为:查t值表(单侧检验), 自由度n’= n-2,若检验水平α =0.01,查得t0.01, n’;比较和判断:若t计算 >t0.01, n’,表示P≤0.01 , x、y的线性关系显著;若t计算 < t0.01, n’,表示P>0.01, x、y的线性关系不显著。1.3 相关系数显著性检验例1:用Ag-DDC法测定砷时,用砷标准溶液测得数据如下表,问实测数据的线性关系是否显著?解: ∑x=29.50,∑y=0.874;; ;则砷含量x/μg 0 0.50 1.00 2.00 3.00 5.00 8.00 10.00吸光度y 0 0.014 0.032 0.060 0.094 0.144 0.230 0.300=68.43;查表,得t0.01 ,6 =3.14t计算 >t0.01, n’ ,故: x、y 线性关系非常显著。回归分析是考察变量之间的数量伴随关系,并通过建立变量之间的数学表达式将这种关系描述出来,进而确定自变量的变化对因变量)的影响程度,从而由自变量的取值预测因变量的可能值。2.线性回归分析根据自变量的数量或变量间的依存关系把回归模型分类如下图:2.线性回归分析自变量一个自变量几个直线回归分析为一元线性线性回归分析,是一个自变量(x)和一个因变量(y)数量依存关系的统计学方法。通过拟合回归方程来描述两变量的依存关系。2.1 直线回归分析步骤直线回归分析步骤取得观察值:(xi,yi) (i = 1,2,3,…….,n);绘制散点图。若散点图成直线关系,可求回归方程;或通过最小二乘法求回归方程的截距和斜率。对回归方程及回归系数进行显著性检验,若回归方程有统计学意义,画出回归直线,写出方程。2.1 直线回归分析步骤直线回归方程是一个二元一次方程,一般形式为:式中: :是因变量,为自变量x的预估值,是直线上点的纵坐标。a:截距, a=0,直线过原点;b:斜率,又称回归系数;自变量化1个单位,因变量变化个单位 。最小二乘法原理:拟合直线时,使各实测点的yi, (i = 1,2,3,…….,n)到拟合直线的估计点的yi 距离最短,用下面公式表达为:实测值 yi 与估计值 y’i之间残差平方和最小。=最小解方程:得到a和b的计算公式如下:=最小ba2.2 判定系数R2=1, 所有的观测点都在直线上。在一元线性回归中 ,判定系数R2与相关系数r2相等,R2=r2 ,开方后二者正负号相同.拟合变差原因来自:(1)自变量x的取值不同;(2)其他因素,例如测量误差。 表示,等于回归偏差与总偏差之比。预估值平均值实测值2.3 回归分析显著性检验回归分析显著性检验是检验回归方程是否真正描述了变量 y 与 x 之间的统计规律性。对于一元线性回归来说,上述三种检验是等价的,只做一种检验即可。回归系数b的检验(t 检验);回归方程的检验(F 检验);相关系数r的显著性检验(t检验).检验方法有:2.4 回归方程的应用在水环境监测中,常通过仪器测定值与待测物含量间的线性回归方程来达到目的。如: 分光光度法中的浓度-吸光度校准曲线;电位法中的浓度对数-电位值校准曲线;色谱法中的浓度-峰面积(或峰高)校准曲线。例2:下表中为酚含量和吸光度的实验数据,用线性回归方程表示酚含量与吸光度的关系,并检查方程是否有意义?解:n = 6,ba回归方程为: y = 0.013 + 3.40 x计算相关系数:=6.220查值表,当 n = 6-2 = 4 时;α =0.01,t0.01,4 =4.60t计>t查表,说明根据实测值得到的方程有显著性意义。`感谢观看! 展开更多...... 收起↑ 资源预览