资源简介 (共16张PPT)基础统计实务项目八:相关分析与回归分析法相关分析与回归分析法8.1.1相关关系的含义(1)函数关系函数关系是指变量之间存在的一种完全确定性的一一对应关系,在这种关系中,对于某一变量的一个数值,都有另一变量的唯一确定的值与之对立。客观世界的各种现象之间,特别是在自然界,广泛存在着函数关系。(2)相关关系相关关系是指变量之间的一种不完全确定的关系,即对于某一变量的每一个数值,另一变量有若干个数值与之相适应在相关关系中,相互联系的现象之间通常存在着一定的、因果关系,这时就把其中起着影响作用的变量叫作自变量(用x来表示),由于受到自变量响而发生变动的变量叫作因变量(用y来表示)。8.1.2相关关系的类型(1)按变量之间相关因素的多少分按变量之间的相关因素的多少分,有单相关和复相关。(2)按变量之间相关关系的方向分按变量之间相关关系的方向分,有正相关和负相关。(3)按变量之间相关关系的表现形式分按变量之间相关关系的表现形式分,有直线相关和曲线相关。(4)按变量之间相关的程度分按变量之间相关的程度分,有完全相关、不相关和不完全相关。相关分析与回归分析法8.1.3相关关系分析的内容(1)相关分析通过相关分析,确定现象之间有无关系及相关关系的表现形式。① 确定现象之间相关关系的类型由于相关分析的研究对象是现象之间的相关关系,然而现象之间有无关系是个定性认识的问题。所以进行相关分析之前,首先要根据经济理论、专业知识和实践经验对被研究对象进行定性判断。当确认现象之间具有相关关系时,才能运用相关分析方法进行定量分析。为了验证定性判断是否正确,还要运用大量的实际资料,通过编制相关表、绘制相关图及计算相关系数对被研究现象是否真正存在相关关系,以及相关关系的形式做出进一步的判断。② 测定现象之间相关关系的密切程度由于相关关系是一种不严格的数量关系,它们的关系有的不大密切,有的比较密切。所以相关分析的一个重要内容,就是要从现象之间不严格的数量关系中想办法来判断它们之间相关关系的密切程度,只有相关关系的密切程度达到一定的标准,对其进行研究才具有实际意义。判断相关关系密切程度的主要方法是计算相关系数或相关指数。相关图表能帮助我们做出一般性的判断,相关系数能从数量上明确说明直线相关关系的密切程度与方向,要确定曲线相关关系的密切程度则需要计算相关指数。相关分析与回归分析法(2)回归分析通过回归分析,说明现象变量之间的数量影响关系。① 建立相关变量之间的一般关系的数学表达式(即回归方程)如果相关的程度高,就需要进行回归分析,即建立相关变量之间的一般关系的数学表达式。如果现象之间表现为直线相关,采用配合直线方程的方法;如果表现为曲线相关,就采用配合曲线方程的方法。所配合的方程称为回归方程式,它是进行判断、推算和预测的依据。② 对因变量估计值的可靠程度进行检验根据回归方程,可以给出自变量的若干数值,求得因变量的相应的估计值。估计值与实际值之间存在误差的,确定因变量估计值误差大小的指标叫作回归误差。回归误差越小,则因变量估计值的可靠程度越高;反之,因变量估计值的可靠程度越低。相关分析与回归分析法8.2.1相关表和相关图对两个现象变量作相关分析时,首先必须取得一系列的成对的统计资料。这是相关分析的原始数据。根据资料是否经过分组,相关表可以分为简单相关表与分组相关表。简单相关表是指根据总体单位的原始资料,将其中一个变量的数值按一定的顺序排列,同时列出与之对应的另一个变量的变量值而形成的表格。例如,研究棉纱产量与单位成本之间的关系,搜集数据排列形成表8—1就是简单相关表。相关分析与回归分析法月份 产量(吨) 单位成本(千元/吨)1 97 7.22 100 73 103 6.94 109 6.75 110 6.56 115 6.57 108 7.28 106 7.29 114 6.810 118 6.8表8—1 某种棉纱产量与单位成本之间的关系相关分析与回归分析法相关图也称散点图,是根据原始数据,在直角坐标中绘制出两个变量相对应的观察值的所有点,从这些点的分布情况观察分析两个变量间的关系,这个图称为相关图。该图表明相关点分布状况,如将上表的资料画在一坐标系中,以x轴代表产量,y轴代表单位成本,各点的分布状况如图,即散点图(相关图)。相关分析与回归分析法分组相关表和相关图当相关资料包括的对应数值很多时,直接根据两变量各原始值编制相关表、绘制相关图进而计算各相关指标,工作量很大,且相关表会很长,也不方便,相关图也不好绘制,在这种情况下,可编制分组相关表或绘制分组相关图。分组相关表是指将原始资料按某一变量的变量值进行统计分组,并计算相对应的变量值的平均数以后整理形成的表格。例如,为研究耕作深度与亩产量的关系,分别搜集了30块地的耕作深度与亩产量的数据,共60个数据值。由于数据多,所以把30块地按耕作深度分组,形成成分组相关表如表8一2。耕作深度(厘米) 田块数(块) 平均亩产量(公斤/亩)81012141618 459741 427498568631683734合计 30 ——表8—2 某乡某农作物耕作深度与平均亩产量分组资料相关分析与回归分析法8.2.2相关系数相关关图表可以帮助我们直观地看出所观察的两个现象的数量变动之间是否存在直线相关关系和相关方向。相关系数是研究和判断两个现象之间线性相关密切程度大小的一个统计分析指标。通常用r来表示。相关系数的最简单的一种计算方法是积差法,它是用两个变量的协方差与其标准差的乘积之比来计算的。其计算公式如下:从上式可以看到,相关系数的性质表现为:(1)取值范围是在一1和+1之间,即一l≤r≤+1;(2)r>0为正相关,r<0则为负相关;(3)r的绝对值越接近于1,表示相关关系越强,越接近于0,表示相关关系越弱;(4)|γ|=1,则表明两个变量完全相关,r=0,则表明两个变量不存在直线相关关系。相关分析与回归分析法分组相关表更能清晰地反映两变量之间相关关系的存在。从分组相关表中可以看出,耕作深度每增加2厘米,平均亩产量增加大致均等的量(即60公斤左右),由此可以初步判断耕作深度与亩产量之间存在直线正相关关系。相关分析与回归分析法8.3.1回归分析的意义(1) 回归分析的含义和种类(2)回归分析的特点一元线性回归分析具有以下特点:① 区分自变量和因变量。两含变量不是对等的,必须区分出自变量和因变量。如果是互为因果关系则根据研究的目的来确定因变量(y)与自变量(x)。② 求回归方程。在没有明显的因果关系的两个变量x与y之间可以求得两个回归方程——y依x的回归方程及x依y的回归方程。两个方程是互相独立的,不能互相替换。③ 回归方程的作用。回归方程的主要作用在于给出自变量的数值来估计因变量的数值。一个回归方程只能做一种推算。相关分析与回归分析法8.3.2直线回归方程的建立与应用直线的一般方程为:y=a+b x,这个方程中的y值是x值的函数,是确定性关系,也就是说只要给定一个x值,y值也就随之确定,但是前面已经讲过,具有相关关系的两个变量之间的数量关系是不严格的、非确定性的。方程式应改写为:式中, 表示因变量的估计值, 为自变量的实际值;a、b为待定参数。其几何意义是:a是直线方程的截距,b是斜率。其经济意义是:a是当x为零时y的估计值,b是当x每变动一个单位时,y平均变动的数量,b也叫回归系数。回归系数b的符号与相关系数r的符号一致并且意义相同。当b的符号为正时,自变量和因变量同方向变动;当b的符号为负时,自变量和因变量反方向变动。回归系数b与相关系数r的区别是:相关系数r的取范围是确定的,即一1至+1之间,而回归系数b的取值并没有一个确定的范围,其大小是依据y的计量单位而确定。相关分析与回归分析法最小平方法配合直线,就是要求实际值与回归值的离差平方和最小。其求a、b参数的方法同任务五中介绍的。相关分析与回归分析法8.3.3回归标准误差估计标准误差是用来说明回归方程代表性大小的统计指标。它是以回归直线为中心反映各观察值与估计值平均数之间离差程度的大小,从另一方面看,也就是反映着估计值平均数yc的代表性的可靠程度,其计算原理与标准差基本相同,计算公式如下:?估计标准误差的计算有两种方法:公式中Syx代表估计标准误差,即x为自变量,y为因变量时的估计标准误差。此种方法在计算时运算量比较大的,也比较麻烦,需计算出所有的估计值。如果已经有了直线回归方程的参数值,可用下面方法计算。在相关回归分析中,估计标准误差的作用主要表现在两个方面:一是可以说明以回归直线为中心的所有相关点的离散程度。估计标准误差值愈小,则所有观察点愈靠近回归直线即关系愈密切;反之,则所有观察点离回归直线愈远,即愈不密切。二是可以说明回归直线的代表性大小。??相关分析与回归分析法 展开更多...... 收起↑ 资源预览