第七章相关分析与回归分析 课件(共46张PPT)-《统计基础(第三版)》同步教学(高教版·2023)

资源下载
  1. 二一教育资源

第七章相关分析与回归分析 课件(共46张PPT)-《统计基础(第三版)》同步教学(高教版·2023)

资源简介

(共46张PPT)
统计基础
Starting from the importance of statistics, this chapter studies the meaning of statistics, several stages of statistical work process, and has a more intuitive understanding of where statistical data come from;
相关分析| 相关系数| 回归分析 | 回归方程
总目录
1
2
3
统计概述
统计调查
统计整理
4
总量指标与相对指标
5
平均指标与变异指标
6
7
8
抽样推断
相关分析与回归分析
时间数列
9
指数分析
相关分析和回归分析
Statistical basis
第7章
Learn the meaning of statistics, several stages of statistical work process, and have a more intuitive understanding of where statistical data come from;
7
第一节 相关分析
第二节 回归分析
1.能熟练运用相关分析方法进行分析;
2.能熟练运用简单回归直线方法开展回归分析;
3.能运用时间数列分析方法和回归分析方法进行简单统计预测。
能力(技能)目标
目标要求
1.掌握相关关系的概念、种类及相关关系的计算方法;
2.掌握回归的概念及简单回归直线方程的求法;
3.掌握估计标准误差的涵义及计算公式;
4.掌握几种常用的预测方法及其应用条件。
知识目标
第一节 相关分析
一、相关关系的概念
事物或现象间在数量上存在着相互依存、相互制约的关系,这种关系可以分为两种类型,一种是确定性关系,即函数关系:变量之间客观存在的确定性的数量对应关系,当自变量取一个值时,因变量就有一个完全确定的值与之对应。
相关关系是客观现象之间确实存在着的数量相互依存关系。它是一种变量之间的不严格、不确定的关系,受着随机因素的影响。
相关关系概念
第一节 相关分析
一、相关关系的概念
出租汽车费用与行驶里程
家庭收入与恩格尔系数
家庭收入高,则恩格尔系数低。
总费用=行驶里程 x 每公里单价
确定性关系
函数关系
非确定性关系
相关关系
第一节 相关分析
一、相关关系的概念
函数关系的例子
函数关系可以用数学表达式来反映
圆的面积(S)与半径之间的关系可表示为:
一 一 对 应 关 系
第一节 相关分析
一、相关关系的概念
商品销售额(y)与广告费支出(x)之间的关系
粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系
收入水平(y)与受教育程度之间的关系(x)
父亲身高(y)与子女身高(x)之间的关系
……
相关关系的例子
现象间不存在一一对应的依存关系
第一节 相关分析
二、相关关系的分类
不完全相关
是指两个变量的关系介于完全相关和完全不相关之间,在统计学中,一般的相关关系指的就是这种关系,相关分析的主要对象是不完全的相关关系
完全不相关
又称零相关,指两个变量的数值之间不存在任何依存关系,彼此独立,互不影响。
完全相关
是指一个变量的数量完全由另一个变量的数量变化所确定,即函数关系。
(一)按相关程度划分
第一节 相关分析
二、相关关系的分类
(一)按相关程度划分
两种现象中一个现象的数量变化,另一现象的数量变化而确定。即函数关系
1.完全相关
如yc=a+bx
函数关系是相关关系的一个特例
第一节 相关分析
二、相关关系的分类
(一)按相关程度划分
两种现象之间的关系,介于完全相关和不相关之间。如农作物产量与播种面积之间的关系。
2.不完全相关
第一节 相关分析
二、相关关系的分类
(一)按相关程度划分
两种现象的数量各自独立,互不影响。
如家庭收入多少与孩子多少之间不存在相关关系
股票价格的高低与气温的高低是不相关的。
3.不相关
第一节 相关分析
二、相关关系的分类
(二)按相关的形式来分
线性相关
又称直线相关,是指当自变量变动时,因变量随之发生大致均等的变动,从图形上看,近似地表现为一条直线。
非线性相关
也称曲线相关,是指当自变量变动时,因变量也随之发生变动,但这种变动不是均等的,从图形上看,近似地表现为一条曲线。
第一节 相关分析
二、相关关系的分类
线性相关
两个变量之间,当自变量X值发生变动时,因变量Y值发生大致均等的变动。在相关图上观察点的分布大致呈现为一条直线。(正比例关系)
非线性相关
两个变量之间,当自变量X值发生变动时,因变量Y值发生不均等的变动。在相关图上观察点的分布表现为抛物线、双曲线、指数曲线等非线性形式。





















第一节 相关分析
二、相关关系的分类
(三)按相关方向来分
正相关
是当自变量的数值增加或减少时,因变量的数值也相应增加或减少。
负相关
是当一现象量增加(减少)另一现象数量减少(增加)。
第一节 相关分析
二、相关关系的分类
正相关
两个变量的变动方向大体上相同时,即自变量X值增加(或减少),因变量Y也相应的增加(或减少)
如家庭消费支出随收入增加而增加。
负相关
两个变量的变动方向相反。即自变量X值增加(或减少),因变量Y随之相应的减少(或增加)
如商品价格降低,其销售量会增多。
















第一节 相关分析
二、相关关系的分类
(四)按相关的因素多少来分
单相关
也叫简单相关,是指两个变量的相关关系,
复相关
是指三个或三个以上变量之间的相关关系。
第一节 相关分析
二、相关关系的分类
相关关系的图示
完全正线性相关
















完全负线性相关









负线性相关









正线性相关












不相关












非线性相关
第一节 相关分析
三、相关分析的任务
1
确定现象之间有无相关关系
2
判定相关关系的方向和密切程度
3
确定相关关系的表现形式
2
确定因变量估计值误差的程度
第一节 相关分析
四、相关关系及程度的测定
定性分析
定性分析是依据研究者的理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系,以及有何种相关关系做出判断
1.相关表
2.相关图
定量分析
变量之间相关关系的定量分析主要通过相关系数分析进行。
相关系数(r)概念
用来测定变量间相关密切程度的指标。
第一节 相关分析
四、相关关系及程度的测定
首先需要定性分析变量之间是否有客观存在的性质上的联系,否则会出现无关事物之间的虚假关系(喝牛奶与得癌症)。在定性判断的基础上,再进行定量分析。
1.定性分析
(1)简单相关表:是一种反映变量之间相关关系的统计表。将一个变量(一般为自变量)按大小顺序排序,然后再将另一个变量(一般为因变量)的对应值排列而成的表格。
2.简单相关表和相关图
第一节 相关分析
四、相关关系及程度的测定
简单相关表举例
将一系列的成对观察值排列在统计表中,就形成了简单相关表。如下表:
按耕作深度分组(厘米) 单产(吨/公顷)
8 10 12 14 16 18 6.0
7.5
7.8
9.1
10.8
12.0
第一节 相关分析
四、相关关系及程度的测定
某地居民家庭月收入和消费支出原始资料
可见,随着家庭月收入的提高,居民的消费支出也有相应提高的趋势,两者之间存在明显的正相关关系。
排列整理后的相关表
5300
1500
3600
6500
1800
6000
4200
2800
1200
2000
7500
1800
4000
9200
2000
8800
6200
3000
1500
2500
10
9
8
7
6
5
4
3
2
1
消费支出
月收入
家庭编号
单位:元
月收入 1500 1800 2000 2500 3000 4000 6200 7500 8800 9200
消费支出 1200 1500 1800 2000 2800 3600 4200 5300 6000 6500
第一节 相关分析
四、相关关系及程度的测定
一般以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。
(2)相关图
消费支出
家庭月收入
第一节 相关分析
四、相关关系及程度的测定
相关图举例
相关图是利用直角坐标,将变量值用相对应的坐标点描绘出来,从坐标点的分布状况观察变量之间的相互关系的图形。如下图:
第一节 相关分析
四、相关关系及程度的测定
点与点之间不可用线段连接。因为,这些坐标点本来就都是一些独立的试验点,正是在这个意义上,相关图也叫散点图。
02
01
自变量应置于横轴上。否则,容易给人造成错觉,不易判断是正相关还是负相关;
绘制相关图时需注意的问题
第一节 相关分析
四、相关关系及程度的测定
3.分组相关表
分组相关表是将相关资料分组后,排列在一张表格上,观察现象之间相关关系的表格。如下表:
按产量分组(千件) 平均成本(元/件)
50以下 50-60 60-70 70-80 90-100 72
73
68
67
64
第一节 相关分析
四、相关关系及程度的测定
对存在相关关系的变量,需要进一步测定相关程度。
英国统计学家卡尔·皮尔逊设计了一个用于测定变量之间线性相关程度和相关方向的统计指标––相关系数(r),公式为:
(二)相关程度的判定
第一节 相关分析
四、相关关系及程度的测定
相关系数的取值范围:-1≤r≤1。
1.当|γ|=1;完全线性相关
2.当0<|γ|<1存在相关
0<|γ|<0.3;微弱
0.3<|γ|<0.5;低度相关;
0.5<|γ|<0.8; 显著相关;
0.8<|γ|<1; 高度相关。
3. 当γ>0正相关;γ<0负相关。
利用相关系数判别相关密切程度的方法
第一节 相关分析
四、相关关系及程度的测定
随堂训练
为了了解某公司员工的工龄与其工作效率之间的相关性,该公司人力资源部进行了一项研究,其目的是想依据研究成果预计员工的工作效率,随机抽取样本如下:计算相关系数,说明相关程度。
解:r=0.3531,微弱相关
员工 工龄 效率分数
小叶 1 6
老王 20 5
小蒋 6 3
小李 8 5
小孙 2 2
小徐 1 2
老唐 15 4
小朱 8 3
第一节 相关分析
四、相关关系及程度的测定
序号 机床使用 年限X 年维修费
Y
1 2 400
2 2 540
3 3 520
4 4 640
5 4 740
6 5 600
7 5 800
8 6 700
9 6 760
10 6 900
11 8 840
12 9 1080
合计 60 8520
第一节 相关分析
四、相关关系及程度的测定
序号 机床使用 年限X 年维修费 Y X   Y  xy
1 2 400 4 160000 800
2 2 540 4 291600 1080
3 3 520 9 270400 1560
4 4 640 16 409600 2560
5 4 740 16 547600 2960
6 5 600 25 360000 3000
7 5 800 25 640000 4000
8 6 700 36 490000 4200
9 6 760 36 577600 4560
10 6 900 36 810000 5400
11 8 840 64 705600 6720
12 9 1080 81 1166400 9720
合计 60 8520 352 6428800 46560

r = 0.8913,包含了两方面的内容:即两个变量相关的方向和相关的程度。正负号说明了相关的方向,具体数字说明了相关的程度。
第一节 相关分析
四、相关关系及程度的测定
使用相关系数判定时应注意以下问题
相关关系不等于因果关系;x y 随机变量
相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;
极端值可能影响相关系数。
警惕虚假相关
第二节 回归分析
一、回归分析的概念与特点
回归分析是对具有相关关系的变量之间数量变化的一般关系进行测定,选择一个合适的数学模型,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。
(一)回归分析的概念
第二节 回归分析
一、回归分析的概念与特点
(1)相关分析是回归分析的基础和前提。
(2)相关关系决定回归分析
如果缺少对现象之间的相关关系作判断,就不能作回归分析,即使勉强做了,有时也没有实际意义。
①相关的类型决定回归的类型
②相关的性质决定回归系数
③现象相关的密切程度决定回归预测的准确程度
④回归分析是相关分析的深入和继续。
相关分析仅仅说明现象之间是否具有关系,它们之间的关系密切程度如何。只有通过回归分析,建立了回归方程,才能从数量上反映变量之间的联系形式,才可进行相应的回归预测,使相关分析具有实际意义。
第二节 回归分析
一、回归分析的概念与特点
回归分析的步骤
根据预测目标,确定自变量和因变量
建立回归预测模型
进行相关分析
检验回归预测模型,计算预测误差
计算并确定预测值
第二节 回归分析
二、简单直线回归分析
就是根据初步确定的直线相关关系类型,拟合一个恰当的直线数学模型,进行一些较精确的计算分析。
即yc=a+bx
简单直线回归分析的特点:
1.确定哪个是自变量,哪个是因变量;
2.自变量x和因变量y不能互换;
3.回归系数a、b具有实际经济意义;
4.自变量是给定的值,因变量是估计值。
第二节 回归分析
二、简单直线回归分析
1.确定自变量和因变量;
2.整理资料;
3.判断相关性质及密切程度;
4.确定回归模型;
5.求参数a、b;
6.确定直线回归方程;
7.直线回归预测
简单直线回归方程确定
第二节 回归分析
二、简单直线回归分析
随堂训练
某农场单位面积施肥费用与单位产量之间的关系如下表,要求绘制散点图,计算相关系数,求回归直线方程。
序号 单位面积施肥费用(元) 单产(KG)
1 2 3 4 5 46 48 52 54 58 720
766
816
960
1020
合计 258 4282
第二节 回归分析
二、简单直线回归分析
绘制相关图
第二节 回归分析
二、简单直线回归分析
计算相关系数r
计算参数a、b的值
直线方程为:
第二节 回归分析
三、估计标准误差
估计标准误差是因变量的估计值与实际观察值之间的平均误差大小的指标。用来说明回归方程的代表性大小的统计指标。其值越小说明估计的值越接近实际值,估计的越准确。一元线性回归的估计标准误差用公式表示为:
第二节 回归分析
三、估计标准误差
Sy:为估计标准误差
y :因变量实际观察值
yC:根据回归方程推算的因变量的估计
n-2:表示估计回归线失去两个自由度,即样本数据的个数减去自变量的个数(m=1),再减1。在实际应用中,当n很大时,一般是n≥30时,计算估计标准误差时就用n来代替n-2。
一元线性回归的估计标准误差的公式
第二节 回归分析
三、估计标准误差
公式简化
回归估计标准差与标准差的区别与联系
1)计算原理是一致的,两者都是反映平均差异程度和代表性的指标。
2)一般标准差反映的是各变量值与其平均数的平均差异程度,表明其平均数对各变量值的代表性强弱;
3)回归标准误差反映的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值的代表性强弱。
第二节 回归分析
三、估计标准误差
估计标准误差小,相关系数的绝对值就越大,表明现象之间相关关系越密切,如果估计标准误差的值等于0,相关系数的绝对值等于1,表明完全相关。 这两个指标在数量上有如下的关系:
相关系数和估计标准误差的关系
谢谢
Starting from the importance of statistics, this chapter studies the meaning of statistics, several stages of statistical work process, and has a more intuitive understanding of where statistical data come from;
相关分析| 相关系数| 回归分析 | 回归方程

展开更多......

收起↑

资源预览