第9章相关与回归分析 课件(共41张PPT) -《统计学基础(第4版)》同步教学(电子工业版)

资源下载
  1. 二一教育资源

第9章相关与回归分析 课件(共41张PPT) -《统计学基础(第4版)》同步教学(电子工业版)

资源简介

(共41张PPT)
第9章
相关与回归
分析
2016/3/12
2
第9章 相关分析与回归分析
相关分析
回归分析
应用相关与回归分析应注意问题
Excel在相关回归分析中的应用
2016/3/12
3
9.1 相关分析
9.1.1相关关系(correlation)的概念
现象间的非确定性的数量上的依存关系
两个特点
⑴确实存在数量上的依存关系
⑵数量依存关系的值不确定
2016/3/12
4
函数关系

数量依存关系值确定
数量依存关系值不确定
相关分析
(correlation analysis)
工 具
对 象
相关关系
2016/3/12
5
9.1.2相关关系的种类
1.按相关程度不同
完全相关
不完全相关
不相关
完全相关
不相关
不完全相关
2016/3/12
6
2.按相关方向不同
正相关
负相关
正相关
负相关
2016/3/12
7
3.按相关的表现形式不同
线性相关
非线性相关
线性相关
非线性相关
2016/3/12
8
4.按相关的变量多少不同
单相关
复相关
两个变量之间的相关关系
三个或三个以上变量的相关关系
单相关
复相关
2016/3/12
9
完全相关
不完全相关
不相关
正相关
负相关
线性相关
非线性相关
单相关
复相关
我们重点研究的
相关关系
2016/3/12
10
9.1.3 相关图表
1.相关表(correlation table)
将一个变量按取值大小顺序排列,将与其相关的另一变量数值对应列出来,便可形成简单相关表。
通过相关表,可初步看出相关关系的形式、密切程度和相关方向。
2016/3/12
11
对我国部分省市人均GDP及人均消费水平进行调查,得原始资料如下表,通过相关表,判断两者相关关系。
地区 北京 辽宁 上海 江西 河南 贵州 陕西
人均GDP22460 11226 34547 4851 5444 2662 4549
人均消费 7326 4490 11546 2396 2208 1608 2035
地区 贵州 陕西 江西 河南 辽宁 北京 上海
人均GDP 2662 4549 4851 5444 11226 22460 34547
人均消费1608 2035 2396 2208 4490 7326 11546
2016/3/12
12
2.相关图 (correlation diagram)
又称散点图(scatter plot),
以横轴表示自变量(dependent variable),
纵轴表示因变量(independent variable),
观察分布状况。
2016/3/12
13
9.1.4 相关系数
1.相关系数的意义(correlation coefficient)
是在直线相关条件下,说明两个变量之间相关关系密切程度和方向的统计分析指标,通常用r表示。
表现形式为相对数
不受变量值水平和计量单位的影响
2016/3/12
14
-1≤r≤+1
r>0
正相关
负相关
r<0
r=+1
线性相关
r=-1
完全负
线性相关
r=0
线性相关
0<|r|<0.3
微相关
0.3≤|r|<0.5
低度相关
0.5≤|r|<0.8
显著相关
0.8≤|r|<1
高度相关
取值范围
4
2
3
1
完全不
完全正
2016/3/12
15
2.相关系数的计算
n表示相关表中数据项数
根据前述资料,已知人均GDP与人均消费水平为直线相关关系,计算人均GDP与人均消费水平的相关系数。
车龄(年)X 10 3 4 2 9 6 4 6 1 7
价格(千美元Y 14 21 20 27 10 23 26 20 27 12
研究者对某品牌汽车的已使用年限(车龄)和其二手
价格进行调查,得原始资料如下所示。计算相关系数
编号 车龄(年)x 价格(千美元)y x2 y2 xy
1 2 3 4 5 6 7 8 9 10 1 2 3 4 4 6 6 7 9 10 27 27 21 26 20 23 20 12 10 14 1 4 9 16 16 36 36 49 81 100 729 729 441 676 400 529 400 144 100 196 27
54
63
104
80
138
120
84
90
140
合计 52 200 348 4344 900
相关系数计算表
=-0.8569

2016/3/12
18
应注意的
问题
相关关系不等于因果关系
r只度量线性关系,弱相关不一定表明没有关系
极端值可能影响相关系数
注意相关关系成立的数据范围
警惕虚假相关
2016/3/12
19
9.2 回归分析
9.2.1回归分析的意义
1.回归(regression)
平均身高
1877年 英国弗朗西斯 高尔顿爵士 遗传学研究 回归线
2016/3/12
20
2.回归分析(regression analysis)
研究一个或几个变量的变动对另一个变量的变动影响程度的方法。
根据资料
建立相应的数学表达式
通过给定自变量的数值估计因变量的可能值
这种分析就叫回归分析
所建立的数学模型称回归模型
2016/3/12
21
9.2.2回归分析的特点
两变量是随机变量
因变量是随机变量
两变量对等
一个相关系数
两变量不对等
两个回归方程
相关系数是
抽象数值
反映相关程度
回归方程具体
可利用自变量
估计因变量值
相关分析
回归分析
2016/3/12
22
9.2.3一元线性回归方程(regression equation)
方程的基本形式
yc=a+ bx
a和b称为回归方程中的两个待定参数
需要根据相关表中的x与y的实际资料求解
a和b一旦确定,
直线就被唯一确定
2016/3/12
23
希望这条直线离各离散点最近
对于相关表中的x,它对应的实际数值y同这条直线上的理论值yc 的离差平方和为最小值。
2016/3/12
24
最小值
最小平方法(least squares analysis)
求极值偏导为0
将a和b代入回归方程,则有:yc=29.3813-1.8041x
仍以前面给出的汽车车龄与二手价格资料为例,运用最小平方法,求解回归方程参数a和b,并建立一元线性回归模型。
若车龄为8年,则其二手价格
yc= 29.3813-1.8041×8=14.9485(千美元)
预测若某汽车的二手价格为18千美元,则估计其车龄为几年?
xc=13.34-0.4070y
当价格为18千美元时,相对应的车龄理论数值为:13.34-0.4070×18=6.014(年)
两个回归方程!
只能做单向推算,
不能进行数学形式上的逆运算
只能给出自变量x的数值来估计因变量y的可能值yc,而不能给定yc逆推x
2016/3/12
28
应该注意的问题
回归系数b与相关系数r符号必一致。即通过回归系数b的符号即可判断两变量相关的方向
回归系数b与相关系数r之间还存在密切数量关系,两者可相互推算
一个直线回归方程只能做一种推算,不能反向进行另一种推算
2016/3/12
29
9.2.4估计标准误差(standard error of the estimate)
因变量实际值与理论值离差的平均值
计算原理与能够反映平均数代表性大小的标准差基本相同
定义公式为:
计算公式:
=
S=
根据前面计算有:a=29.3813,b=-1.8041;由n=10,
仍以前面有关资料为例,计算估计标准误差
2016/3/12
31
r越大
回归直线代表性大
r越小
回归直线代表性小


2016/3/12
32
9.2.5判定系数(coefficient of determination)
用 表示
是相关系数r的平方
用来测定回归方程拟合数据的好坏程度
范围在0与1之间
越大,线性回归效果就越好
2016/3/12
33
9.3 应用相关和回归分析应注意的问题
在定性分析基础上进行定量分析
注意现象质的界限及相关关系作用的范围
将各种分析指标结合应用
尽可能使用大样本材料
2016/3/12
34
9.4 Excel在相关回归分析中的应用
9.4.1 利用Excel进行相关分析
(1)用函数求相关系数
在EXCEL中,计算两个变量之间相关系数的函数为CORREL函数。
第一步:单击任一个空白单元格,本例中选定的单元格为F4,单击“插入”菜单,选择“函数”选项,弹出“粘贴函数”对话框,在对话框的左侧“函数分类”中选择“统计”,在右侧的“函数名”中选择CORREL,单击确定后,出现CORREL对话框。
2016/3/12
35
第二步:在“CORREL”对话框中的“array1”和“array2”框中分别输入用于计算相关系数的两组数据所在的单元格区域。本例中,在array1中输入B2:B16,在array2中输入C2:C16,即可在对话框下方显示出计算结果为0.9803。
第三步:单击确定,即可在选定的空白单元格显示出相关系数。本例在F4单元格显示相关系数0.9803。
2016/3/12
36
(2)相关系数工具
采用相关系数工具计算相关系数的操作步骤如下:
第一步:单击“工具”菜单,选择“数据分析”选项。打开“数据分析”对话框,从其对话框的“分析工具”列表中选择“相关系数”,单击确定,打开“相关系数”对话框
2016/3/12
37
第二步:在“相关系数”对话框中确定输入区域和输出选项。在“输入区域”框中输入分析数据所在的单元格区域。在本例中,输入区域为$B$1:$C$16。分组方式中指出输入区域中的数据是按行还是按列排列,本例为“逐列”。若输入区域包括列标志行,则选中“标志值位于第一行”复选框,本例选中此复选框。
在“输出选项”对话框中可以指定结果的输出去向,输出去向有三种。在“输出区域”框中输入输出结果所在的单元格区域。在本例中,输出区域为$F$$4。也可以通过选择“新工作表”或“新工作薄” 将结果放在新工作表或新工作薄。
2016/3/12
38
第三步:单击“确定“按钮,在指定位置给出计算结果。
2016/3/12
39
9.4.2 利用Excel进行回归分析
第一步:单击“工具”菜单,选择“数据分析”选项。打开“数据分析”对话框,从其对话框的“分析工具”列表中选择“回归”选项,单击“确定“按钮,打开“回归”对话框。
第二步:在“回归”对话框中确定输入区域和输出区域
2016/3/12
40
第三步:单击“确定“按钮后,在指定位置给出计算结果。
谢谢!

展开更多......

收起↑

资源预览