09第九章相关与回归分析 课件(共37张PPT)-《统计学(第三版)》同步教学(高教版·2020)

资源下载
  1. 二一教育资源

09第九章相关与回归分析 课件(共37张PPT)-《统计学(第三版)》同步教学(高教版·2020)

资源简介

(共37张PPT)
第九章
相关与回归分析
《统计学》课件
教学目的与要求
教学重点与难点
通过本项目学习,了解相关与回归分析的概念;掌握相关系数的计算方法;并能够建立适当的回归模型和进行回归预测。
重点:计算相关系数;回归方程的建立;
难点:估计标准误差的计算;相关与回归分
析应注意问题。
本章的主要内容
相关与回归分析
应注意的问题
回归分析
相关分析
第一节 相关关系
现象间的依存关系通常有两类:函数关系和相关关系。
(一)函数关系
函数关系指现象间存在的严格数量依存关系。即某现象变化必然引起另一现象的唯一确定的相应变化,这种关系可用数学表达式反映。
如: 圆的面积=
利息额=存款额×利率 等等。
一、相关分析的意义
自变量和因变量
(二)相关关系
相关关系指现象间确实存在的非严格的数量依存关系。其特征是:一种现象发生变化,会引起另一种现象的变化,但这种变动关系并非唯一确定。
统计学成绩
教学学时
数学成绩
出勤率
师生比
学习时间
学风
校园环境
等等…
※ 相关关系的种类




因素多少
相关形式
相关方向
相关程度
单相关
复相关
正相关
负相关
线性相关
曲线相关
完全相关
不完全相关
零相关
(三)相关分析法及其作用
相关分析是通过对大量数字资料的观察,消除偶然因素的影响,探求现象之间相关关系的密切程度和表现形式的一种统计方法。相关分析的对象是相关关系。
在研究相关关系时,为了找到现象间数量关系的内在联系和表现形式,常常要借助于函数关系的形式加以描述。
相关分析的作用:通过相关分析,可以确定现象相关关系的形式、方向和程度;为回归分析奠定基础;为回归预测提供参考数据。
※ 相关分析方法之相关表
相关表是根据相关变量的原始数据,按自变量和因变量的对应关系平行排列在一张表格上而形成的统计表。它是相关分析的一种最简单的方法,可以粗略地反映变量之间相关关系的形式和密切程度。在相关表中,自变量数值按从小到大顺序排列。
若因变量的数值也是由小到大发生大致均等的变化,则属直线正相关;反之,属直线负相关。
若因变量的数值开始时随着自变量的增大而增加,当自变量增加到一定程度时,因变量数值则随自变量的增加而减少,则为二次曲线相关;
若因变量的数值开始时随着自变量的增大而逐渐增加,当自变量增加到一定程度时,因变量随自变量增加的幅度增大,则这种相关关系为指数曲线相关。
相关表法 实例
企业编号 月产量(千吨) 生产费用(万元)
1
2
3
4
5
6
7
8 1.2
2.0
3.1
3.8
5.1
6.1
7.2
8.0 62
86
80
110
115
132
135
160
合计 36.4 880
可以看出,生产费用(因变量)随着月产量(自变量)的增加而逐渐增加,可判断二者是直线正相关关系。
企业月产量与生产费用相关表
※ 相关分析方法之相关图
相关图的绘制方法:先绘制直角坐标系,横轴
代表自变量X,纵轴代表因变量Y,将X和Y的
对应值在直角坐标系中画出坐标点,所有坐标
点组成的图形,就称相关图。
相关图优点:可直观判断相关关系的类型
相关图类型
相关图类型(续)
相关图实例
根据企业月产量和生产费用资料绘制相关图
可以看出,相关点分布近似为一条上升直线,且关系比较密
切,说明月产量与生产费用之间存在直线正相关关系。
※ 相关分析方法之相关系数
相关系数是表明现象之间相关关系的密切程度的指标。它是相关分析的重要指标。
由于不同现象所涉及的相关因素多少不同以及相关分析目的的差异,相关系数又可以分为直线相关系数、曲线相关系数、复相关系数和偏相关系数四种。
直线相关系数
直线相关系数是测定现象之间直线相关的方
向和密切程度的统计指标。计算公式:
★ 直线相关关系的判断
r取值在-1到+1之间,或者|r|≦1。
相关系数r的符号只表示相关的方向。
|r|表示相关的程度。
|r|≦0.3 基本无关
0.3<|r|≦0.5 低度相关
0.5<|r|≦0.8 显著相关
0.8<|r|<1 高度相关
特殊:r=o 无直线相关 |r|=1完全相关
★ 直线相关系数的计算实例
相关系数计算表
企业
编号 月产量
(千吨)x 生产费用
(万元)y
1
2
3
4
5
6
7
8 1.2
2.0
3.1
3.8
5.1
6.1
7.2
8.0 62
86
80
110
115
132
135
160 1.44
4.00
9.16
14.44
25.00
37.21
51.84
64.00 3844
7396
6400
12200
13225
17424
18225
25600 74.4
172.0
248.0
418.0
575.0
805.2
972.0
1280.0 66.8
77.13
91.30
100.00
115.80
129.99
144.17
154.49 23.04
78.68
127.69
93.50
0.64
4.04
90.09
30.36
合计 36.4 880 207.54 104214 4544.6 880.00 448.05
★ 曲线相关系数
曲线相关系数又称为相关指数,是测定两变量之间曲线相关密切程度的统计指标。
复相关系数
复相关系数是反映一个因变量与一组自变量之间相关程度的统计指标。它是直接利用原资料的几个简单相关系数计算的。在有两个自变量时,复相关系数计算公式:
复相关系数的取值介于0和1之间,即0 第二节 回归分析
一、回归分析的概念和特点
(一)回归分析的概念
回归分析就是将现象的相关关系转变为函数关系,并建立反映变量之间数量变动关系的数学表达式,以便进行估计或预测的统计分析方法。
(二)回归分析的特点
1、回归分析的两个变量是非对等关系。
回归分析需确定自变量和因变量。因变量是随
机变量,是根据给定的自变量值推算出来的。
而相关分析中的变量都是随机变量,只能计算变
量间
密切关系的指标。
2、一般来说,回归中两个变量一定呈相关关系,
而相关的两个变量就不一定呈回归关系。
3、回归分析中,若因果关系不明确或互为自变量,可分
别建立y对于x的方程或x对于y的方程。
二、回归分析的内容
(一)确定现象之间相关关系的数学模型
测定变量间数量变化关系,建立描述现象间相关关系的数学模型即回归方程,用函数关系式近似地表现相关关系,作为推算、预测的根据。
(二)测定数学模型的拟合精度
拟合精度直接影响统计分析结论的准确性,建立模型后需要对其精确度进行检验。一般通过计算估计标准误差来测定模型的拟合精度。
三、回归分析与相关分析的关系
区别:相关分析研究变量间相关关系及其密切程度。回归分析是建立反映变量关系的数学表达式,来研究变量间数量变动关系的统计分析方法。
联系:相关和回归分析是研究现象间依存关系不可分割的两个方面。一般先测定相关现象间相关程度,进而决定是否进行回归分析并拟合回归方程并进行推算和预测等。
相关分析是回归分析的基础和前提,回归分析是相关分析的继续和深入。只有当变量间存在
高度 相关时,进行回归分析才有意义。
四、回归分析的种类




变量多少
时间状况
表现形式
简单回归
复回归
直线回归
曲线回归
静态回归
动态回归
(一)一元回归分析
1.直线回归分析
根据自变量和因变量的数值资料,配合一条回归直线来表示变量间的一般数量变化关系。
直线回归方程的一般形式是:
根据最小平方法的要求,可得出直线回归方程中的参数a、b的求解方程组:
(一)一元回归分析(续1)
※ 直线回归方程中的回归系数b有正有负,正回归表示上升直线,说明两变量之间是同方向的变动。
※ 回归系数b和相关系数r不但含义不同,取值也不同,但符号必须是
一致的。相关系数与
回归系数之间的关系:
(一)一元回归分析(续2)
2.二次曲线回归分析
将自变量的观察值按由小到大依次排列,然后计算自变量的一次差和因变量的二次差,若自变量的一次差和因变量的二次差分别接近一个常数,则现象之间的关系属二次曲线形式:
根据最小平方法的要
求,可得出二次曲线
方程中参数a、b、c
的求解方程组:
(二)复回归分析
研究一个因变量与多个自变量之间相关关系的理论和方法,称为多元回归分析或复回归分析。多元回归可分为多元线性回归与多元非线性回归。
多元线性回归方程表达一个因变量与多个自变量之间线性关系的一种数学模型。其方程为:
需要注意:此处求参数的方法仍然用最小平方法
五、估计标准误差
由于所研究的现象间的相关程度并非完全相关,用回归方程进行预测是有误差的,回归方程求出后有必要对其拟合精度进行检测。
估计标准误差就是进行这种
检测的统计分析指标,说明
直线回归方程代表性大小。
估计标准误差与相关系数间的关系
第三节 相关和回归分析应注意的问题
一、定性分析和定量分析相结合
要判断现象间是否存在相关关系,是什么样的相关关系,主要靠定性认识。即运用有关专业理论知识,丰富的实践经验和分析判断问题的能力,获得准确的定性认识之后,才能运用相关与回归分析方法进行定量分析。如果把没有关系的现象当作是相关现象,运用相关回归分析来测定它们之间的数量变化关系,就会发生“虚假相关”现象,从而导致认识上的错误。(相关-研究;不相关-不研究;未知-研究)
二、回归分析以相关分析为基础
相关分析与回归分析互相联系。
★回归是对现象间联系的定量分析方法,相关分析反映的是现象间相互联系的方向和密切程度。回归分析研究的是有相关关系的现象间的数量变动关系。
★相关分析是回归分析的前提和条件。现象之间有无显著的相关关系是进行回归分析的先决条件。只有通过计算相关系数或相关指数证明现象间确实存在显著的相关关系时,对有关资料进行回归分析才是有效的。
三、对回归效果进行检验
相关系数、回归系数、回归方程、估计标准误差都是根据样本数据求得的,但所得出的是一般性结论。显然,这里存在一个样本的代表性问题。因此,使用相关系数、回归模型进行统计分析时,还要对其有效性进行检验。
四、多种回归模型配合,择优选择方案
在进行回归分析时,为了保证分析结果的准确性,对于同一资料要配合多种回归方程,计算实际值与估计值的回归误差,选择误差最小的方程式作为进行回归分析和估计的模型。
相关
分析

回归
分析
回归分析
相关分析
注意问题
相关关系的概念
相关关系的种类
相关关系的判断
回归分析的概念
回归分析的类型
回归方程的建立
回归误差的计算
定性分析和定量分析结合
回归分析与相关分析结合
多种回归模型的择优选择
《相关与回归分析》知识结构图

展开更多......

收起↑

资源预览