07第七章 相关与回归分析 课件(共69张PPT)- 《现代统计学》同步教学(西工大版)

资源下载
  1. 二一教育资源

07第七章 相关与回归分析 课件(共69张PPT)- 《现代统计学》同步教学(西工大版)

资源简介

(共69张PPT)
01 统计指数的基本知识
02 综合指数的编制
03 平均指数的编制
04 指数体系
(一)相关关系的概念
在经济活动中,我们常常发现许多现象之间存在一定的数量关系。例如,成本、产量、价格、利润中的一个或几个变量发生变化,就会引起其他变量的变化。现象之间的相互联系、相互制约构成了错综复杂的社会经济关系。我们可以把这些复杂关系区分为两大类,即函数关系和相关关系。
1.函数关系(Function)
函数关系是指客观现象之间确实存在的,且在数量上表现为确定性的,可以用数学表达式来描述的相互依存关系。在函数关系中,一个变量完全依赖于另一个变量,我们将这两个变量分别称为自变量和因变量。若用x,y分别表示自变量和因变量,它们之间的函数关系可用下式表示:y=f(x)
例如,正方形的周长y和边长x存在y=4x的函数关系;当x的值发生变化时,y的值也随之发生变化;二者是一对一的关系:当已知x的值时,可通过关系式精确地得到y的值。
一、相关关系概述
第一节 相关关系与回归分析
(一)相关关系的概念
2.相关关系(Correlation)
相关关系是指客观现象之间确实存在的,但在数量上表现为不确定的相互依存的关系。在相关关系中,一个变量不是完全依赖于另一个变量,它同时受其他变量的影响。若变量x与变量y间呈相关关系,则可用下式表示:y=f(x)+ε,式中:ε表示误差项,或者称为干扰项。
比如,商品价格和销售量之间的关系。一般来说,价格上升,销售量会随之下降。但价格上升幅度与销售量减少数量之间并不存在确定的数量关系。有时价格上升了,销售量反而有所增加。这是因为影响销售量的因素,除了价格之外,还有收入、个人爱好、季节等因素。也就是说价格和销售量之间存在相互依存关系,但这种关系在数量上是不确定的。
在相关关系中,现象之间存在一定的因果关系。其中,把起着影响作用的现象称为自变量,把受自变量影响而发生变动的现象称为因变量。如对商品价格和销售量而言,价格是自变量,销售量是因变量。通常,用x表示自变量,用y表示因变量。
但在相关关系中,有时现象之间只存在相互关系而并不一定存在因果关系。
一、相关关系概述
第一节 相关关系与回归分析
(一)相关关系的概念
3.函数关系与相关关系的区别与联系
(1)区别:具有相关关系的变量之间的数量关系不确定,而具有函数关系的变量之间的数量关系是确定的。
(2)联系:函数关系往往通过相关关系表现出来,相关关系也常常借助函数关系的方式进行研究。由于认识局限和测量误差等原因,确定性的函数关系在实际中往往表现为相关关系;反之,当人们对事物的内部规律了解得更深刻的时候,相关关系又可能转化为确定性的函数关系。
一、相关关系概述
第一节 相关关系与回归分析
(二)相关关系的种类
1.按现象相关因素的多少,划分为单相关与复相关
单相关就是一个变量对另一个变量的相关关系,即两个现象的相关,例如投资额与国内生产总值之间的关系。
所研究的是一个变量对两个或两个以上其他变量的相关关系,称为复相关。例如,某种商品的销售额与其价格水平和人们收入水平之间的相关关系。
2.按现象之间的相关方向,划分为正相关与负相关
正相关(Positive Correlation)就是两个现象的变化方向一致,当一个现象的数量由小变大时,另一个现象的数量也相应由小变大,这种相关称为正相关。例如,职工的工资水平随劳动生产率的提高而增加。
负相关(Negative Correlation)就是两个现象的变化方向相反,当一个现象的数量由小变大时,另一个现象的数量相反地由大变小,这种相关称为负相关。例如,随着销售额的增加,流通费用率下降。
一、相关关系概述
第一节 相关关系与回归分析
(二)相关关系的种类
3.按现象之间相关的形式,划分为直线相关与曲线相关
直线相关(Linear Correlation)(也称线性相关)是指一个变量随另一个变量的变化发生比例大致相等的变动,例如居民家庭的支出与收入之间的关系。
曲线相关(Curve Correlation)(也称非线性相关)是指一个变量随另一变量的变化发生比例不均等的变动。例如施肥量和亩产量的关系:在一定的数量界限内,当施肥量增加时,亩产量也相应地增加,体现为直线相关;当施肥量增加到一定的程度时,亩产量反而下降。这就是曲线相关。
一、相关关系概述
第一节 相关关系与回归分析
(二)相关关系的种类
4.按现象之间相关的程度,划分为不相关、不完全相关和完全相关
当变量之间完全不存在任何关系,即一个变量发生数量上的变化时,另一个变量完全不发生数量变化,这种关系就是不相关(Irrelevance)。不相关就是两变量互不影响,也叫零相关。例如,气温与股票价格指数之间的关系。
一个变量完全随另一个变量的变化而变化,这种关系就是完全相关(Complete Relevance)。完全相关就是两变量的数量变化关系是确定性的关系,它实际是函数关系,例如圆的半径与面积之间的关系。
当变量之间的关系介于不相关和完全相关之间时,这种关系就是不完全相关(Incomplete Relevance),例如居民的收入水平与恩格尔系数之间的关系。一般的相关关系都指不完全相关。
一、相关关系概述
第一节 相关关系与回归分析
(三)相关关系的内容
相关分析的主要目的在于分析现象间相关关系的密切程度和变化规律,为下一步的回归分析打下基础。它主要包括以下三个方面。
1.确定现象之间是否存在相关关系
判断现象之间是否存在依存关系是相关分析的起始点。只有存在相互依存关系,才有必要和可能进行相关分析。
2.确定相关关系的表现形式
判明了现象相互关系的具体表现形式,才能运用相应的相关分析方法去研究。
3.判定相关关系的方向和密切程度
现象之间的相关关系是一种不严格的数量依存关系,相关分析就是要从这种松散的数量关系中判定其相关关系的方向和密切程度。
一、相关关系概述
第一节 相关关系与回归分析
相关分析只能说明两个变量之间相关的方向和密切程度,不能说明两个变量之间的数量变化规律。要反映变量之间数量变化的规律,必须在相关分析的基础上,进一步进行回归分析。
(一)回归分析的概念
回归这个统计术语,最早采用者是英国遗传学者高尔登,他把这种统计分析方法应用于研究生物学的遗传问题,指出生物后代有回归到其上代原有特性的倾向。高尔登的学生皮尔逊继续研究,把回归的概念和数学方法联系起来,进行回归分析。
回归分析(Regression Analysis),就是通过一个变量或一些变量的变化解释另一变量的变化。
二、回归分析概述
第一节 相关关系与回归分析
(二)回归分析的种类
1.按变量之间相关的形式,分为线性回归与非线性回归
线性回归是指变量之间的相关形式是直线相关,可建立直线回归方程来研究其数量变化规律。非线性回归是指变量之间的相关形式是曲线相关,可建立曲线回归方程来研究其数量变化规律。
2.按自变量的个数,分为一元回归与多元回归
一元回归是指一个自变量与一个因变量之间的数量关系。多元回归是指两个或两个以上的自变量与一个因变量之间的数量关系。一元回归分析是多元回归分析的基础,多元回归分析是一元回归分析的拓展。
二、回归分析概述
第一节 相关关系与回归分析
(三)回归分析的内容
回归分析的主要内容如下:
1.确定现象之间的相关关系的数量模型
确定了现象间确实有相关关系及密切程度,就要选择合适的数学模型,对变量之间的联系给予近似的描述。如果现象之间的关系表现为直线相关,则采用配合直线的方法;如果现象之间的关系表现为各种曲线,则用配合曲线的方法。可根据自变量选取个数不同,构造一元回归方程和多元回归方程。使用这种方法能使我们找到现象之间相互依存关系的数量上的规律。这是进行判断、推算、预测的根据。
2.测定变量估计值的可靠程度
配合直线或曲线后,可反映现象间的变化关系,也就是说,自变量变化时因变量如何变化及有多大变化。根据这个数量关系,可测定因变量的估计值。把估计值与实际值进行对比,如果它们的差别小则估计得较准确;反之,就不够准确。这种因变量估计值的准确程度,通常用估计标准误差来衡量。
3.预测因变量
对回归方程变量之间的相关性进行显著性检验。通过统计检验后,利用回归模型,根据自变量去估计、预测因变量。
二、回归分析概述
第一节 相关关系与回归分析
回归分析与相关分析既有联系,也有区别。
(一)回归分析与相关分析的联系
第一,相关分析要依靠回归分析来表现现象之间的数量关系的具体形式。
第二,回归分析必须依靠相关关系来表明变量之间的密切程度。从广义上讲,回归分析就是相关分析;从狭义上讲,相关关系只需确定变量间的关系,而回归分析还要在此基础上建立数学模型。
(二)回归分析与相关分析的区别
第一,相关分析不说明哪个是自变量,哪个是因变量,而回归分析必须首先确定谁是自变量,谁是因变量,不能颠倒。
第二,相关分析中的每一个变量都是随机的;回归分析中自变量是一般变量,因变量是随机变量。
相关分析与回归分析具有一定的局限性,即现象之间是否存在真实的相关关系,必须由相关学科来确定。因此,相关与回归必须在定性分析的前提下进行,不能进行纯数量的计算。
三、相关分析与回归分析的关系
第一节 相关关系与回归分析
(一)相关表
相关表(Correlation table)就是把所取得的数据以表的形式显示出来,据此观察变量之间的数量变化是否有关,从而判断有无相关关系的方法。相关表有简单相关表和分组相关表。
1.简单相关表
把其中一个变量的值按顺序排列,另一个变量的值一一对应地列在同一张表格上,即形成简单相关表。
一、相关表与相关图
第二节 简单线性相关分析
(一)相关表
2.分组相关表
(1)单变量分组相关表。
它是按其中一个变量分组,列出各组的次数,另一个变量不分组的相关表。根据表7-1的数据,按照人均可支配收入分组,汇总如表7-2所示。
由表7-2可以看出,人均现金消费支出随人均可支配收入的增加而增加,两者具有正相关关系。
一、相关表与相关图
第二节 简单线性相关分析
(一)相关表
2.分组相关表
(2)双变量分组相关表。
它是两个变量都分组的相关表。根据表7-1的数据,按照人均可支配收入和人均现金消费支出分组,汇总如表7-3所示。
一、相关表与相关图
第二节 简单线性相关分析
(二)相关图
相关图(Correlation Graph),亦称散点图。它是在直角坐标图中,将两个变量一个作横坐标一个作纵坐标,把它们对应地绘制在二维图形上,通过观察数据点的分布情况,大致看出两个变量之间有无相关关系及类型。相关图可通过Excel绘制。
图7-1是根据表7-1数据绘制的散点图。
一、相关表与相关图
第二节 简单线性相关分析
(二)相关图
由图7-1可以判断人均可支配收入和人均现金消费支出之间存在很强的直线正相关关系。
图7-2是不同形态的散点图,我们可以根据相关图散点的分布特征判断变量之间的相关形式及相关方向。
一、相关表与相关图
第二节 简单线性相关分析
相关表和相关图都只能初步反映两个变量之间是否存在相关关系,以及相关的形式、方向和程度等,并不能精确地反映两个变量之间的相关强度。计算相关系数可以精确地反映两个变量之间是否存在直线相关关系,以及相关的方向、密切程度。
(一)相关系数的概念
相关系数(Correlation Coefficient)是在两个变量直线相关的条件下,测定变量之间相关方向和相关密切程度的统计指标,通常用r表示。其全称是直线积差相关系数。
它是著名英国统计学家卡尔·皮尔逊(Karl Pearson)提出的方法。此法根据两个变量与各自平均数的离差乘积的平均数来求得相关系数。
二、相关系数
第二节 简单线性相关分析
(二)相关系数的计算
二、相关系数
第二节 简单线性相关分析
(二)相关系数的计算
二、相关系数
第二节 简单线性相关分析
(二)相关系数的计算
二、相关系数
第二节 简单线性相关分析
(二)相关系数的计算
二、相关系数
第二节 简单线性相关分析
(二)相关系数的计算
二、相关系数
第二节 简单线性相关分析
(二)相关系数的计算
二、相关系数
第二节 简单线性相关分析
(三)相关系数的密切程度
相关系数的数值有个范围,在-1和+1之间,即-1≤r≤1。计算结果带有负号表示负相关,带有正号表示正相关。
相关系数r的数值越接近于1(+1或-1),表示相关关系越强。当r=1,为完全正相关,当r=-1,为完全负相关,表明变量之间为完全线性相关,即函数关系。r越接近于0,表示相关关系越弱,r=0,表示两变量无线性相关关系。
为了判断时有个标准,有人提出了相关关系密切程度的等级可根据经验将相关程度分为以下几种等级。
相关系数在0.3以下为无相关;0.3以上为有相关:0.3~0.5是低度相关,0.5~0.8是显著相关,
0.8以上是高度相关。
二、相关系数
第二节 简单线性相关分析
(三)相关系数的密切程度
按照上述分类标准来进行判断,计算相关系数的原始材料要比较多,例如在50个以上。计算时根据的材料多,关系程度就可以相信;如果材料太少,则可以相信的程度会降低,也就是判断有相关关系的起点值要提高,要以0.4或0.5等为起点。
在例7-1中,r=0.969 7,表明该企业产品产量(千吨)与表示生产费用(万元)之间为高度正相关关系。在例7-2中,r=0.96,表明2012年各省市城镇居民人均可支配收入和人均现金消费支出之间也为高度正相关关系。
二、相关系数
第二节 简单线性相关分析
(四)相关系数的显著性检验
在对两个变量x与y进行线性相关分析时,当某些现象间并无相关关系时通过样本数据计算,有时也能得到一个比较大的r值,这时就会产生虚假的相关系数。为什么会出现这种情况呢 在实际的分析研究中,往往是利用一个区段或时段的样本数据,根据其对应值计算r值,因而带有一定的随机性,并受抽样误差的影响,而且样本容量越小随机性越大,其可信程度就越低。相关关系能否真实地表现变量总体的相关关系受到随机因量和样本容量大小的影响。在作出结论之前,有必要检验样本的r值是否可能来自一个不存在线性相关的总体(即ρ=0,ρ为总体的相关系数),即r的显著性检验。
通过r值在统计上是否显著,可以说明它能否作为两个变量间存在线性关系的依据:若r在统计上是显著的,就证明两个变量间存在线性关系;反之,则说明两个变量之间不存在线性关系。
对于线性相关,为了评价相关系数的显著性,在小样本(n<30)情况下,通常采用t分布来检验r的显著性,其方法和步骤如下:
二、相关系数
第二节 简单线性相关分析
(四)相关系数的显著性检验
二、相关系数
第二节 简单线性相关分析
(四)相关系数的显著性检验
二、相关系数
第二节 简单线性相关分析
在回归分析中,我们用y表示要解释或预测的变量,称为因变量;用x表示用来解释或预测因变量的一个或多个变量,称为自变量。当自变量只有一个,且因变量y和自变量x之间的关系为线性时,称为一元线性回归。
例如,在分析人均可支配收入对人均支出的影响时,我们研究的目的是人均支出在一定的收入水平下是多少,因此人均支出是要预测的变量,即因变量;人均可支配收入是用来预测支出水平的变量,即自变量。
一、一元线性回归的概念
第三节 简单线性回归分析
(一)一元线性回归方程
1.一元线性回归模型
二、一元线性回归方程及其确定
第三节 简单线性回归分析
(一)一元线性回归方程
2.一元线性回归方程
二、一元线性回归方程及其确定
第三节 简单线性回归分析
(二)一元线性回归方程的估计
1.估计a、b的几种方法
二、一元线性回归方程及其确定
第三节 简单线性回归分析
(二)一元线性回归方程的估计
2.a、b的最小二乘估计
二、一元线性回归方程及其确定
第三节 简单线性回归分析
二、一元线性回归方程及其确定
第三节 简单线性回归分析
回归模型的检验包括理论意义检验、一级检验和二级检验。
理论意义检验涉及参数估计值的符号和取值区间,应与人们的实践经验或实质性科学的理论相符。如GDP与工业总产值之间应为正相关,从而以GDP为因变量建立的回归方程中,b应取正值,如果为负,则不能通过理论意义检验。理论意义检验不能通过,可能是因为样本数据太少,或者是不能满足标准线性回归分析所要求的假定条件。
一级检验,又称统计学检验,包括拟合程度评价和显著性检验(分回归方程的显著性检验和回归系数的显著性检验)。二级检验,又称经济计量学检验。它是对标准线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验等。本书只介绍一级检验。
三、一元线性回归方程的检验
第三节 简单线性回归分析
(一)拟合优度检验
拟合优度是指回归直线对观测值的拟合程度。拟合优度检验是用来检验观测数值与依照某种假设或分布模型计算得到的理论数是否一致性的一种统计假设检验,以便判断该假设或模型是否与实际观测数相吻合。显然,从总体来看,观测数值与理论值越接近,拟合度就越高;反之,拟合度就越低。判断回归模型拟合程度优劣最常用的数量指标是可决系数(又称判定系数)。
三、一元线性回归方程的检验
第三节 简单线性回归分析
(一)拟合优度检验
三、一元线性回归方程的检验
第三节 简单线性回归分析
(一)拟合优度检验
三、一元线性回归方程的检验
第三节 简单线性回归分析
(一)拟合优度检验
三、一元线性回归方程的检验
第三节 简单线性回归分析
(一)拟合优度检验
三、一元线性回归方程的检验
第三节 简单线性回归分析
(二)回归分析中的显著性检验
我们利用随机观测到的几对有关x与y的样本数据,采用最小平方法得到的回归系数b是否符合回归方程的基本假设,需要进行检验。回归系数b与0是否有显著差异,表明总体回归系数β是否为0。若β=0总体回归线就是一条水平线,x与y之间无线性关系,违背了一元线性回归方程的基本假设;若β≠0,x与y之间存在着线性关系,符合假设条件,所建立的一元线性回归方程可以认为符合变量间的变化规律。对回归系数b的检验就是要验证变量x与y之间是否真正存在线性关系,一般采用t检验,其步骤如下:
三、一元线性回归方程的检验
第三节 简单线性回归分析
(二)回归分析中的显著性检验
三、一元线性回归方程的检验
第三节 简单线性回归分析
三、一元线性回归方程的检验
第三节 简单线性回归分析
三、一元线性回归方程的检验
第三节 简单线性回归分析
(一)多元线性回归方程
四、多元线性回归
第三节 简单线性回归分析
(一)多元线性回归方程
四、多元线性回归
第三节 简单线性回归分析
(一)多元线性回归方程
四、多元线性回归
第三节 简单线性回归分析
(一)多元线性回归方程
四、多元线性回归
第三节 简单线性回归分析
(一)多元线性回归方程
四、多元线性回归
第三节 简单线性回归分析
(一)多元线性回归方程
四、多元线性回归
第三节 简单线性回归分析
(二)多元线性回归模型的判定系数和估计标准误差
同一元线性回归方程一样,对已确定的二元线性回归方程可以从判定系数和标准误差两方面测定拟合度。
四、多元线性回归
第三节 简单线性回归分析
(二)多元线性回归模型的判定系数和估计标准误差
四、多元线性回归
第三节 简单线性回归分析
一、抛物线回归模型
第四节 曲线回归分析
一、抛物线回归模型
第四节 曲线回归分析
一、抛物线回归模型
第四节 曲线回归分析
一、抛物线回归模型
第四节 曲线回归分析
二、双曲线回归模型
第四节 曲线回归分析
二、双曲线回归模型
第四节 曲线回归分析
二、双曲线回归模型
第四节 曲线回归分析
二、双曲线回归模型
第四节 曲线回归分析
三、指数曲线回归模型
第四节 曲线回归分析
三、指数曲线回归模型
第四节 曲线回归分析
三、指数曲线回归模型
第四节 曲线回归分析
三、指数曲线回归模型
第四节 曲线回归分析
三、指数曲线回归模型
第四节 曲线回归分析

展开更多......

收起↑

资源预览