项目六 相关与回归分析 课件(共48张PPT)-《统计原理与实务课件(第二版)》同步教学(高教版)

资源下载
  1. 二一教育资源

项目六 相关与回归分析 课件(共48张PPT)-《统计原理与实务课件(第二版)》同步教学(高教版)

资源简介

(共48张PPT)
(第二版)
统计原理与实务
线性相关分析
01
一元线性回归分析
02
项目六 相关与回归分析
教学目标
【知识目标】
1.了解相关分析的内容;掌握相关关系概念、种类;
2.了解直线相关分析的方法;掌握相关系数的计算与意义;
3.了解一元直线回归的概念和作用;掌握一元直线回归方程的建立方法及意义;
【能力目标】
1.能熟练运用相关系数分析经济现象之间的联系;
2.能熟练运用简单数学模型分析经济现象。
项目案例
某职业院校会计专业二年级共1个班总计30人,随机抽取10人,数学与统计成绩如表6-1所示。
表6-1 二年级1 班10人相关数据统计表
学生序号 1 2 3 4 5 6 7 8 9 10
数学成绩(分) 86 90 79 76 83 96 68 80 76 60
统计成绩(分) 81 91 63 81 81 96 67 90 78 54
思考:1.你知道表中数据是否有联系吗吗?
2.如果有联系,根据表中数据,应如何计算分析?
3.如果某同学数学是95分,统计成绩会考多少分?
6-1 线性相关分析
相关分析就是研究两个或两个以上变量之间相互关系密切程度的统计分析方法。
判断现象之间的相关状态。
判断相关关系的密切程度。
确定相关关系的数学表达示。
3
2
1
检测因变量估计值的误差。
4
一、相关分析及其主要内容
二、相关关系及其种类——(一)相关关系
根据因变量对自变量的不同反应可以把依存关系划分为两种不同的类型,即函数关系和相关关系。
函数关系是指现象之间客观存在的,在数量变化上按一定变化规律严格确定的相互依存关系。
相关关系是一种不完全确定的依存关系,它不能够用数学表达式准确反映出来。
相关关系具有如下两个特点:
(1)相关关系表现为数量上的依存关系。
(2)相关关系中所表现出数量上的依存关系是不确定的。
二、相关关系及其种类——(一)相关关系
(1)二者的区别
①函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的,可以在一定范围内变动;
②函数关系变量之间的依存可以用一定的方程表现出来,可以给定自变量来推算因变量,而相关关系则不能用一定的方程表示。
(2)二者的联系
由于存在测算误差等原因,函数关系在实际工作中常常要通过相关关系来表现。而在研究相关关系时,为了找到现象之间数量关系的内在联系和表现形式,又常常需要借助于函数关系的形式加以描述。
二、相关关系及其种类——(二)相关关系的种类
不相关
如果两个变量之间有一定联系,当一个变量变化,另一个变量也会随之变化,但不存在严格的函数关系,其密切程度介于完全相关和不相关之间,则称为不完全相关。
完全相关
如果一个变量的值完全由另一个变量值所决定,则称两个变量为完全相关,也就是函数关系。
不完全相关
如果两个变量各自独立,互不影响,则称两个变量为不相关。
1.按相关的密切程度:
二、相关关系及其种类——(二)相关关系的种类
通过对具有相关关系的两个变量进行调查,获得一系列成对观察值,将其在平面直角坐标系中绘出相应的点。
如果这些点的分布大致成一条直线,则称为线性相关。
如果这些点的分布并不表现为直线关系,而近似于某种曲线方程关系,如抛物线、指数曲线、双曲线等,则称为非线性相关。
2.按相关的形式分为线性相关和非线性相关:
二、相关关系及其种类——(二)相关关系的种类
负相关
如果两个变量的变动方向相反,即当一个变量增加或减少,另一个变量随之减少或增加,则称负相关。
正相关
在线性相关中,如果两个变量的变动方向相同,即当一个变量增加或减少,另一个变量也随之增加或减少,则称正相关。
3.按相关的方向分为正相关和负相关:
二、相关关系及其种类——(二)相关关系的种类
负相关
三个或三个以上变量间的相关关系称为多元相关,又称复相关。
正相关
两个变量间的相关关系称为简单相关,又称单相关。
4.按影响因素的多少分为单相关和复相关:
三、相关表
相关表
是将通过对被研究对象调查所得到的一系列成对观察值,按一定顺序加以排列所形成的统计表。
根据资料是否分组,相关表可分为简单相关表和分组相关表。
三、相关表——(一)简单相关表
案例
为研究产量与单位成本之间的关系,调查某地区20家同类工业企业产量与单位成本资料如表6-1所示:
简单相关表
资料未分组的情况下编制的相关表,称为简单相关表。是将成对观察值按照自变量值从小到大的顺序一一对应平行排列起来所形成的统计表。
三、相关表——(一)简单相关表
表 6-2 2017年某地区20家同类工业企业产品产量与单位成本统计表
序号 产量(吨) 单位成本(元/吨) 序号 产量(吨) 单位成本(元/吨)
1 500 1 000 11 700 900
2 800 890 12 800 880
3 600 950 13 1 000 720
4 700 960 14 600 900
5 900 740 15 800 850
6 1 000 700 16 600 920
7 500 980 17 700 920
8 800 900 18 800 870
9 700 910 19 800 850
10 600 940 20 900 800
三、相关表——(一)简单相关表
表 6-1 2017年某地区20家同类工业企业产品产量与单位成本相关表
序号 产量(吨) 单位成本(元/吨) 序号 产量(吨) 单位成本(元/吨)
1 500 980 11 800 850
2 500 1 000 12 800 850
3 600 900 13 800 870
4 600 920 14 800 880
5 600 940 15 800 890
6 600 950 16 800 900
7 700 900 17 900 740
8 700 910 18 900 800
9 700 920 19 1 000 700
10 700 960 20 1 000 720
根据表6-2中的数据,按产量由小到大的顺序加以排列,单位成本依次对应排列编制简单相关表,如表6-3所示:
三、相关表——(二)分组相关表
种类
根据分组标志的多少,分组相关表可分为单变量分组相关表和双变量分组相关表两种。
只按自变量分组而形成的相关表,称为单变量分组相关表。
将自变量和因变量都进行分组而形成的相关表,称为双变量分组相关表。
分组相关表
在简单相关表的基础上,将原始数据按一定标志进行分组后编制而成的相关表,称为分组相关表。
三、相关表——(二)分组相关表
表 6-4 产量与单位成本单变量分组相关表
案例:根据表6-3中的数据,按产量进行单项式分组,汇总出每组出现的次数,并计算各组单位成本的算术平均数,就可以编制出单变量分组相关表6-4:
产量(吨) 企业数 平均单位成本(元/吨)
500 2 990
600 4 928
700 4 923
800 6 873
900 2 770
1 000 2 710
三、相关表——(二)分组相关表
表 6-5 产量与单位成本双变量分组相关表
案例:根据表6-4中的数据,将产量按单项式分组,分为6组,单位成本按组距式分组,分为4组,编制双变量分组相关表6-5:
单位成本(元/吨) 产量(吨) 合计
500 600 700 800 900 1 000 1 000以上 1 1
900~1000 1 4 4 1 10
800~900 5 1 6
800以下 1 2 3
合计 2 4 4 6 2 2 20
四、相关图
根据相关表中的成对观测值在直角坐标第一象限所绘制的点状图形,称为相关图,也叫散点图。
常见的几种相关图:
图6-2 正线性相关 图6-3 负线性相关 图6-4 曲线相关 图6-5 不相关
四、相关图
根据上述表6-3中的数据绘制相关图,如图6-6所示:
图 6-6 产量和单位成本相关图
产量(吨)
0 500 600 700 800 900 1 000
1 000
950
900
850
800
750
700
单位成本(元/吨)
从图6-6中可以看出,产量和单位成本的相关图呈现出一定的规律性,大致为一条向下的直线,表明二者之间存在负线性相关关系。
五、相关系数——(一)相关系数的概念及特点
在线性相关的条件下,用于测定两个变量之间相关程度和相关方向的统计分析指标即相关系数,一般用 表示,它是相关分析的重要指标。
相关系数具有以下三个特点:
1.两变量为对等关系,可以不区分自变量和因变量,其相关系数只有一个值;
2.相关系数有正负号,反映正相关或负相关;
3.若以抽样调查取得资料,则两变量均应有相同的随机性,这也是对等关系的要求。对全面统计资料而言,不存在随机性的问题,均为确定性资料。
五、相关系数——(二)相关系数的计算公式
相关系数定义公式为:
式中:
,称为 的协方差
,是自变量 数列的标准差
,是因变量 数列的标准差
所以相关系数可表现为如下形式:
相关系数具有如下性质:
1.相关系数 的取值范围在[-1,+1]之间;
2.当 时,表明 与 为完全线性相关, 与 之间存在确定的线性函数关系;
3.当 时,表明 的变化与 没有关系,即 与 没有线性相关关系;
4.当 时, 表明 与 为正相关;
5.当 时,表明 与 为负相关;
6.当 时,表示表明 与 存在着一定的线性相关。 越大,越接近于1,表明线性相关程度越高; 越小,越接近于0,表明线性相关程度越低;
五、相关系数——(二)相关系数的计算公式
判断相关密切程度的一般标准是,当 时,称为微弱相关;当 时,称为低度相关;当 时,称为显著相关;当 时,称为高度相关。
五、相关系数——(二)相关系数的计算公式
1.根据未分组资料计算相关系数,公式如下:
五、相关系数——(三)计算相关系数的方法
背景资料:为了解餐饮业消费金额与小费金额之间的数量关系,从若干名消费者中随机抽取了10名消费者进行调查,所得数据如表6-5所示。
五、相关系数——(三)计算相关系数的方法
表6-6 消费者消费金额与小费金额统计表 单位:元
消费金额 33.5 50.7 87.9 98.8 63.6 107.3 120.7 78.5 102.3 140.6
小费金额 5.5 5.0 8.1 17 12 16 18.6 9.4 15.4 22.4
分析过程:
根据表6-6中的数据资料,编制相关系数计算表,如表6-7所示:
五、相关系数——(三)计算相关系数的方法
序号 消费金额(元) 小费金额(元)
1 33.5 5.5 1122.25 30.25 184.25
2 50.7 5 2570.49 25 253.5
3 63.6 12 4044.96 144 763.2
4 78.5 9.4 6162.25 88.36 737.9
5 87.9 8.1 7726.41 65.61 711.99
6 98.8 17 9761.44 289 1679.6
7 107.3 16 11513.29 256 1716.8
8 102.3 15.4 10465.29 237.16 1575.42
9 120.7 18.6 14568.49 345.96 2245.02
10 140.6 22.5 19768.36 506.25 3163.5
合计 883.9 129.5 87703.23 1987.59 13031.18
表6-7 相关系数计算表 单位:元
分析过程:
五、相关系数——(三)计算相关系数的方法
相关系数为0.92,说明消费者的消费金额与小费金额之间有高度的线性正相关关系。
2.根据分组资料计算相关系数,公式如下:
五、相关系数——(三)计算相关系数的方法
背景资料:试根据表6-4中所示资料计算相关系数,并判断产品产量与单位成本之间的相关密切程度。
分析过程:
根据表6-4,设产量为 ,平均单位成本为 ,企业数为 ,编制相关系数计算表,如表6-8所示。
五、相关系数——(三)计算相关系数的方法
五、相关系数——(三)计算相关系数的方法
500 990 2 1 000 1 980 990 000 500 000 1 960 200
600 928 4 2 400 3 712 2 227 200 1 440 000 3 444 736
700 923 4 2 800 3 692 2 584 400 1 960 000 3 407 716
800 873 6 4 800 5 238 4 190 400 3 840 000 4 572 774
900 770 2 1 800 1 540 1 386 000 1 620 000 1 185 800
1 000 710 2 2 000 1 420 1 420 000 2 000 000 1 008 200
合计 20 14 800 17 582 12 798 000 11 360 000 15 579 426
表6-8 产量与单位成本相关系数计算表 单位:元
相关系数为-0.949,说明产量与单位成本之间存在高度的负相关关系。
相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。
五、相关系数——(四)相关系数的缺点
6-2 一元线性回归分析
广义的相关分析包括相关分析和回归分析两方面的内容。
回归分析就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个与之相对应的数学表达式,以便进行估计或预测的统计方法。
一、回归分析与相关分析的关系
1.二者的联系:
(1)相关分析是回归分析的基础和前提。
(2)回归分析是相关分析的深入和继续。
一、回归分析与相关分析的关系
2.二者的区别:
(1)分析的内容不同。
(2)对变量的要求不同。
(3)交换自变量和因变量对计算结果影响不同。
回归分析与相关分析的联系与区别:
回归分析的种类:
根据回归分析的方法得出的数学表达式,称为回归方程(回归模型),它有多种形式,可以是直线方程,也可以是曲线方程。
若拟合的是直线方程,则为线性回归分析;若拟合的是曲线方程,则为非线性回归分析。
根据回归线的形状不同分
当只有一个自变量时,称为一元回归分析;
当自变量有两个或多个时,称为多元回归分析;
根据自变量的个数不同分
一、回归分析与相关分析的关系
概念:一元线性回归方程也叫简单直线回归方程,是根据成对的两个变量的数据而配合的直线方程式。
二、一元线性回归方程
配合一元线性回归方程的条件:
1.两个变量之间确实存在显著的相关关系。
2.两个变量之间确实存在直线相关关系。
3.具备一定数量的变量观察值。
二、一元线性回归方程
回归方程:
式中:
—— 的估计值或预测值;
——直线的起点值,在数学上称为直线的纵轴截距,即当自变量为零时,因变量的估计值;
——自变量每增加一个单位时因变量的平均增减量,称为回归系数,数学上称斜率。
式中:
二、一元线性回归方程
整理成方程组:
解方程组即得计算a和b的计算公式如下:
背景资料:2018年,某市调查10家同类生产企业,得到其生产性固定资产年平均价值与工业增加值的数据资料,具体见表6-10所示。
企业 固定资产 工业增加值
1 2 3 4 5 6 7 8 9 10 3.2 9.1 2.0 4.1 4.2 5.0 3.1 12.1 10.2 12.3 5.2
10.2
6.6
8.2
9.1
9.3
6.1
15.2
12.2
16.2
表 6-10 10家同类企业固定资产与工业增加值调查表 单位:百万元
要求:
1.计算相关系数,判断生产性固定资产年平均价值与工业总产值的相关密切程度;
2.求出回归方程,估计当企业的固定资产为12百万元时,其工业增加值是多少?
二、一元线性回归方程
二、一元线性回归方程
分析过程:
根据表6-10中的数据资料,编制简单相关表并进行计算,具体见表6-11。
企业 固定资产 工业增加值
1 2.0 6.6 13.20 4.00 43.56
2 3.1 6.1 18.91 9.61 37.21
3 3.2 5.2 16.64 10.24 27.04
4 4.1 8.2 33.62 16.81 67.24
5 4.2 9.1 38.22 17.64 82.81
6 5.0 9.3 46.50 25.00 86.49
7 9.1 10.2 92.82 82.81 104.04
8 10.2 12.2 124.44 104.04 148.84
9 12.1 15.2 183.92 146.41 231.04
10 12.3 16.2 199.26 151.29 262.44
合计 65.3 98.3 767.53 567.85 1 090.71
表 6-11 固定资产与工业增加值相关与回归分析计算表 单位:百万元
二、一元线性回归方程
根据公式计算相关系数:
计算结果 =0.9470,说明固定资产与工业增加值之间存在高度正相关关系,可以进一步进行回归分析,求解回归方程。
二、一元线性回归方程
设关于固定资产( )与工业增加值( )的回归方程为:
将表6-11中相关数据代入公式计算,可得:
则一元线性回归方程为:
二、一元线性回归方程
式中,回归系数b=0.8882,表示当生产性固定资产每增加1百万元,工业增加值平均增加0.8882百万元。计算结果显示,回归系数b与相关系数r同为正数,若 ,则 ,变量呈正相关;若 ,则 ,变量呈负相关。因此,回归系数b的正负可以反映出相关的方向,需要注意的是,回归系数的大小不能反映相关的密切程度。
当企业的固定资产为12百万元时,其工业增加值的估计值为:
项目六小结
巩固练习
见教材:
1.项目案例:127页
2.案例拓展:147页
3.课后习题:149页
THANKS
2021年

展开更多......

收起↑

资源预览