第9章一元线性回归分析 课件(共58张PPT)-《应用统计学》同步教学(电工版)

资源下载
  1. 二一教育资源

第9章一元线性回归分析 课件(共58张PPT)-《应用统计学》同步教学(电工版)

资源简介

(共58张PPT)
第 9 章
一元线性回归分析
9.1 相关分析
9.2 回归分析
9.3 一元线性回归模型的假定及系数估计
9.4 一元线性回归模型的检验
9.5 一元线性回归模型的预测
9.6 用Stata软件进行相关性分析和回归分析
第 9 章
一元线性回归分析
全面理解相关分析和回归分析的含义、分类、主要内容及两者之间的关系;
掌握一元线性回归模型的基本假定;
掌握普通最小二乘法(OLS)的基本原理,能够应用OLS估计一元线性回归模型的参数并检验其有效性;
掌握一元线性回归模型的点预测和区间预测;
掌握Stata软件操作方法,能够应用Stata软件解决一元线性回归分析的实际问题。
本章教学目的
第 9 章
一元线性回归分析
掌握一元线性回归模型的基本假定;
掌握普通最小二乘法(OLS)的基本原理,能够应用OLS估计一元线性回归模型的参数并检验其有效性;
能够应用Stata软件解决一元线性回归分析的实际问题。
本章重点和难点
第 9 章
9.1.1 相关关系的含义
9.1.2 相关关系的分类
9.1.3 相关分析的主要内容
9.1.4 相关关系的测量
9.1 相关分析
第 9 章
世界是一个普遍联系的整体。无论是自然现象之间还是社会现象之间,大都存在着不同程度的联系。在日常生活中,人们经常使用一些俗语,如“名师出高徒”“龙生龙,凤生凤”“虎父无犬子”等来说明现象之间的相关关系。各现象之间的关系形式多种多样,但可以分为两类:一类是确定的函数关系,另一类是不确定的相关关系。
1.函数关系
2.相关关系
9.1 相关分析
9.1.1 相关关系的含义
第 9 章
1.函数关系
函数关系反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每个数值,都有另一个变量的确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。例如, ,这里,圆的面积是随半径大小而变动的。再如,企业的原材料消耗额y,与产量 、单位产量消耗 、原材料价格之间的关系可以表示为 。
9.1 相关分析
9.1.1 相关关系的含义
第 9 章
2.相关关系
相关关系反映现象之间切实存在的,而关系数值不确定的相互依存关系。理解相关关系要把握两个要点。
(1)相关关系是指现象之间切实存在数量依存关系。两个现象之间,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。
(2)现象之间数量依存关系的具体关系值不是确定的。在相关关系中,当一种现象的数量发生变化时,另一种现象的数量表现出一定的波动性,但又总是围绕着它们的平均数并遵循一定的规律而变化。
9.1 相关分析
9.1.1 相关关系的含义
第 9 章
1.按相关关系的表现形态来划分,可分为直线相关和曲线相关
相关关系是一种数量上不严格的相互依存关系。如果这种关系近似地表现为一条直线则称为直线相关,从图形上看,其观测点的分布近似地表现为一条直线。例如,人均消费水平与人均收入通常呈线性关系。如果这种关系近似地表现为一条曲线则称为曲线相关。从图形上看,其观测点的分布近似地表现为一条曲线,这就是一种非线性关系。曲线相关也有不同的种类,如抛物线、指数曲线、双曲线等。研究现象的相关关系,究竟取哪种形态,要对现象的性质做理论分析,并结合实际经验,才能得到较好的解决。
9.1 相关分析
9.1.2 相关关系的分类
第 9 章
2.按直线相关变化的方向来划分,可分为正相关和负相关
解释变量数值增加,被解释变量数值也相应地增加,这叫作正相关。例如,儿童数量增加,玩具销售量也会增加。解释变量数值增加,被解释变量数值相应地减少,或者解释变量数值减少,被解释变量数值相应地增加,这叫作负相关。例如,产品生产越多,生产成本越低;商品价格降低,商品销售量增多。
9.1 相关分析
9.1.2 相关关系的分类
第 9 章
3.按相关的程度来划分,可分为完全相关、不完全相关和无相关
两种现象中一种现象的数量变化,随另一种现象的数量变化而确定,这两种现象间的依存关系,就称为完全相关,如,在这种情况下,相关关系就是函数关系。两种现象的数量各自独立,互不影响,称为无相关,如企业生产成本与工人年龄之间,一般是无相关的。两个现象之间的关系,介于完全相关与无相关之间,称为不完全相关。通常相关分析主要是不完全相关分析。
9.1 相关分析
9.1.2 相关关系的分类
图9-1 相关关系种类
第 9 章
4.按相关关系涉及的因素多少来划分,可分为单相关和复相关
两个因素之间的相关关系叫作单相关,即研究时只涉及一个解释变量和一个被解释变量,因此也称一元相关,如广告费支出与产品销售量之间的相关关系。
三个或三个以上因素的相关关系叫作复相关,也称多元相关,即研究涉及两个或两个以上的解释变量和被解释变量,如商品销售额与居民收入、商品价格之间的相关关系。
9.1 相关分析
9.1.2 相关关系的分类
第 9 章
1.判断现象之间有无关系,以及相关关系的具体表现形式
在进行相关分析时,首先,通过理论定性的分析方法或利用图表观察的方法,判断现象之间是否有关系。现象之间有关系,进行相关分析才有意义。其次,判断现象之间相关关系的表现形态,以便在之后的分析中选择相应的分析方法。
2.确定相关关系的密切程度
根据变量数据的类型,选择适当的方法,计算出相关系数,确定现象之间相关关系的密切程度,为进一步的分析提供依据。
9.1 相关分析
9.1.3 相关分析的主要内容
第 9 章
3.检验现象统计相关的显著性
检验现象统计相关的显著性包括检验相关关系的存在性,检验相关关系强度是否达到一定水平,检验两对现象相关程度的差异性,估计相关系数的取值。
4.对相关关系的数学形式加以描述
广义地说,相关关系分析还包括对相关关系的数学形式加以描述,即拟合回归方程,检验回归方程的合理性,并且应用回归模型进行统计分析、预测和控制。
9.1 相关分析
9.1.3 相关分析的主要内容
第 9 章
在相关分析中,通过定性分析、制作相关表、绘制相关图等,可以对现象间存在的相关关系的方向、形式和密切程度做直观、大致地判断。为了精确衡量简单线性相关关系的相关程度,还可以利用相关系数进行分析。
1.定性分析
2.相关表
3.相关图
4.简单线性相关系数
9.1 相关分析
9.1.4 相关关系的测量
第 9 章
1.定性分析
在研究相关关系时,应根据一定的经济理论和实践经验的总结,对社会经济现象进行科学的定性分析,以判断它们之间是否具有相关关系及相关关系的类型。只有在定性分析的基础上、才能进一步从数量上来测定现象之间的相关关系及相关的密切程度。这是判断相关关系的一种重要方法,也是相关分析的重要前提。
9.1 相关分析
9.1.4 相关关系的测量
第 9 章
2.相关表
研究现象之间的依存关系,首先要通过实际调查取得一系列的数据,作为相关分析的原始资料。将某一变量按其数值的大小顺序排列,然后将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。
9.1 相关分析
9.1.4 相关关系的测量
例如,对某公司8年的销售额和广告费进行调查,得到的资料如表9-1所示。
表9-1 销售额和广告费的相关表
单位:万元
广告费 10 12 15 20 25 28 33 35
销售额 15 18 22 26 30 34 41 43
从相关表9-1可以看出,随着广告费的增加,企业的销售额也在增加,两变量间存在明显的正相关关系。
第 9 章
3.相关图
相关图又称散点图,是以直角坐标系的横轴代表变量x,纵轴代表变量y,将两变量相对应的成对数据用坐标点的形式描绘出来,用以反映两变量之间相关关系的图形。
例如:从图9-2可以看到,图中各个点虽不完全在一条直线上,但可以认为,该企业的销售额和广告费之间有较强的直线相关关系。
9.1 相关分析
9.1.4 相关关系的测量
图9-2 销售额与广告费的相关图
第 9 章
4.简单线性相关系数
在各种相关中,单相关是基本的相关关系,它是复相关和偏相关的基础。单相关有线性相关和非线性相关两种表现形式。测定线性相关系数是最基本的相关分析,是测定其他相关系数方法的基础。所以,首先研究线性的单相关系数,即简单线性相关系数,也就是在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相关系数。
(1)总体简单线性相关系数
(2)样本简单线性相关系数
(3)简单线性相关系数的显著性检验
9.1 相关分析
9.1.4 相关关系的测量
第 9 章
(1)总体简单线性相关系数。
对于所研究的总体,表示两个相互联系变量线性相关程度的相关系数称为总体简单线性相关系数,用 表示,其计算公式为:
式中,Cov(x,y)表示变量x和y的协方差,用 表示,即
式中,D(x)、 分别表示变量x的方差和标准差;D(y)、 分别表示变量y的方差和标准差。
9.1 相关分析
9.1.4 相关关系的测量
第 9 章
总体简单线性相关系数具有如下特点:
① 对于特定的总体来说,x和y的数值是既定的,即总体简单线性相关系数是客观存在的特定数值;
② 因为总体的两个变量的所有数值是不可能直接观测的,所以总体简单线性相关系数一般是未知的。
9.1 相关分析
9.1.4 相关关系的测量
第 9 章
(2)样本简单线性相关系数。
由于总体简单线性相关系数是不可直接观测的,需要从总体中抽取样本容量为n的一个样本,通过x和y的样本观测值计算简单线性相关系数,此简单线性相关系数称为样本简单线性相关系数,又称为皮尔逊(Pearson)相关系数。它用来测量定距变量间的线性相关关系(如测量身高与体重、工龄与收入等),记为rxy,简记为r,其基本计算公式为:
“积差法”
9.1 相关分析
9.1.4 相关关系的测量
式中,xi和yi分别表示x和y的样本观测值; 和 分别表示x和y的样本观测值的均值。
简化
第 9 章
【例】根据表中的数据,试计算销售额与广告费的简单线性相关系数
9.1 相关分析
9.1.4 相关关系的测量
解:该公司销售额与广告费的简单线性相关系数计算如表9-2所示。
表9-2 销售额与广告费的简单线性相关系数计算表
序 号 销售额y(万元) 广告费x(万元) xy y2 x2
1 15 10 150 225 100
2 18 12 216 324 144
3 22 15 330 484 225
4 26 20 520 676 400
5 30 25 750 900 625
6 34 28 952 1 156 784
7 41 33 1 353 1 681 1 089
8 43 35 1 505 1 849 1 225
合计 229 178 5 776 7 295 4 592
计算结果表明,该公同的销售额与广告费之间存在着程度较高的正线性相关关系。
第 9 章
(3)简单线性相关系数的显著性检验。
样本简单线性相关系数r是根据样本观测值(xi,yi)(i=1,2,…,n)计算出来的,是对总体简单线性相关系数 的一个估计。样本不同,所计算出来的样本简单线性相关系数也不同,所以,样本简单线性相关系数r是一个随机变量。因此,由样本简单线性相关系数r来判别变量x和y是否具有相关性需要经过统计检验才能确定。
① 样本简单线性相关系数r的分布。
② 简单线性相关系数的检验步骤。
9.1 相关分析
9.1.4 相关关系的测量
第 9 章
【例】对表9-2中销售额与广告费的简单线性相关系数进行检验( =0.05)。
解:设
选取检验统计量
则有
因为α=0.05,所以
故|t| = 26.966 8>2.446 9,拒绝H0,即总体相关系数 在统计上显著不为零,也就是说,销售额与广告费之间的线性相关显著。
使用[例9-2]的数据,用Stata计算相关系数并进行检验的输出结果如下:
结果表明,该公同的销售额与广告费之间的相关系数为0.995 9,并且二者的线性相关显著。
9.1 相关分析
9.1.4 相关关系的测量
第 9 章
9.2.1 回归分析的含义
9.2.2 回归分析的分类
9.2.3 回归分析的主要内容
9.2.4 相关分析与回归分析的关系
9.2 回归分析
第 9 章
“回归”一词最先由弗朗西斯·高尔顿(Francis Galton)引入,他被誉为现代回归和相关技术的创始人。一个总体在某一时期具有某一极端特征(低于或高于总体均值)的个体(或者是单个个体,或者是整个子代)在未来的某一时期将减弱它的极端性,这一趋势现在被称为“回归效应”。
然而“回归”的现代含义与高尔顿对“回归”一词的解释是不同的。“回归”的现代含义大致上可以解释为:一个被解释变量对其他解释变量的依存关系。其目的在于通过解释变量的值来估计或者预测被解释变量的均值。
9.2 回归分析
9.2.1 回归分析的含义
第 9 章
1.按照变量的个数来分,可分为一元回归分析和多元回归分析
只有一个解释变量的回归分析称为一元回归分析,又称简单回归分析。两个或两个以上解释变量的回归分析称为多元回归分析,又称复回归分析。
2.按照回归线的形状来分,可分为线性回归分析和非线性回归分析
当相关变量之间的表现形式为线性相关时,为其拟合的直线回归方程所进行的回归分析称为线性回归分析。
当变量之间的表现形态为曲线相关时,为其拟合的曲线方程所进行的回归分析称为非线性回归分析。
9.2 回归分析
9.2.2 回归分析的分类
图9-3 回归分析的类型
第 9 章
1.确定现象之间相关关系的数量模型
确定了现象之间确实有相关关系及密切程度,就要选择合适的数学模型,对变量之间的联系给予近似的描述。如果现象之间的关系表现为直线相关,则采用配合直线的方法;如果现象之间的关系表现为各种曲线,则采用配合曲线的方法。可根据解释变量选取个数的不同,构造一元回归方程或多元回归方程。使用这种方法可以找到现象之间相互依存关系的数量上的规律性,这是进行判断、推算、预测的根据。
2.对回归分析模型进行检验和评价
模型的参数是用变量的观测值估计的,为了检验参数估计值是否为抽样的偶然结果,需要运用数理统计中的统计推断方法,对模型及参数的统计可靠性做出说明。通常应用最广泛的统计推断检验准则有拟合优度检验、单个变量的显著性检验和整个回归模型的显著性检验,分别采用R 、t、F 作为检验统计量。计量经济检验一般包括异方差性检验、自相关性检验、多重共线性检验等。
3.预测被解释变量
要预测被解释变量,应该先对回归方程变量之间的相关性进行显著性检验,通过统计检验后,再利用回归模型,根据解释变量去估计、预测被解释变量。
9.2 回归分析
9.2.3 回归分析的主要内容
第 9 章
相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量关系的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在显著相关时,进行回归分析寻求其相关的具体形式才有意义。如果没有对变量之间是否相关及相关方向和程度做出正确判断就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间的相互关系的具体形式,也无法从一个变量的变化情况来推测另一个变量的变化情况,因此,在具体应用过程中,只有将相关分析和回归分析结合起来,才能达到研究和分析的目的。
9.2 回归分析
9.2.4 相关分析与回归分析的关系
第 9 章
9.3.1 一元线性回归模型及其假定
9.3.2 一元线性回归模型回归系数估计
9.3 一元线性回归模型的假定及系数估计
第 9 章
通常,一元线性总体回归模型可表示为∶
式中, 表示个体i在被解释变量 上的取值; 表示一个随机变量; 表示个体i在解释变量 上的取值; 表示模型的参数,通常是未知的,需要根据样本数据进行估计; 反映了 的变化所引起的 的变化; 表示误差项或扰动项,包括遗漏的其他因素、变量的测量误差、回归函数的设定误差及人类行为的内在随机性等,即 反映了除之外的所有其他因素对 的影响。
图9-4给出了三个不同的 值下 的分布。
9.3 一元线性回归模型的假定及系数估计
9.3.1 一元线性回归模型及其假定
图9-4 三个不同的xi值下y和e 的分布
第 9 章
由于总体回归参数 、 是未知的,所以必需利用观测值去估计,得到 、 的估计量 、 ,再用 、 分别代替 、 ,从而得到估计的回归方程(也称样本回归直线或样本回归方程)为:
式中, 表示估计的回归直线在y轴上的截距; 表示直线的斜率,即x每变动一个单位时,y的平均变动值。
任意给定一条直线, ,可以计算每个点(观测值)到这条直线的距离,
,称为残差。如果直接把残差加起来,即 ,则会出现正负相抵的现象。解决方法之一是使用绝对值,即 。但绝对值不容易运算,故考虑其平方 ,称为残差平方和。普通最小二乘法(Ordinary Least Squares,简称OLS)就是选择,使得残差平方和最小化。在数学上,可将OLS的目标函数写为:
9.3 一元线性回归模型的假定及系数估计
9.3.2 一元线性回归模型回归系数估计
第 9 章
根据微积分知识,此最小化问题的一阶条件为:
解上述方程组得:
9.3 一元线性回归模型的假定及系数估计
9.3.2 一元线性回归模型回归系数估计
第 9 章
【例】利用表9-2的数据,求销售额对广告费的估计方程。
解:根据公式得:
故销售额对广告费的线性回归方程为 。回归系数 表示广告费每增加1万元,销售额增加1.078万元。在回归分析中,截距 通常不做实际意义的解释,或者仅当广告费用为0时,销售额为4.640万元。
9.3 一元线性回归模型的假定及系数估计
9.3.2 一元线性回归模型回归系数估计
第 9 章
9.4.1 模型估计式检验的必要性
9.4.2 模型参数估计值的经济意义检验
9.4.3 回归直线的拟合优度
9.4.4 回归系数的显著性检验
9.4 一元线性回归模型的检验
第 9 章
1.模型中解释变量选择的正确性需要证明
线性回归模型中解释变量的选择,一般是研究者依据某些经济理论的说明或经济活动实践经验进行确定的。对于具体的研究对象,模型中究竟应当包含哪些解释变量、应当包含多少个解释变量,最终还得由研究者进行综合分析、判断加以决定。在这种情况下,解释变量的选择就会存在偏差。而解释变量的选择对模型设定的正确性影响较大,必须对此做出评价。
2.模型函数形式的正确性需要验证
与解释变量选择的情形类似,线性回归模型函数形式的选择,一般也是依据经济理论和实际经验加以确定的。
3.模型估计的可靠性需要评价
线性回归模型的估计式来源于样本,而不是直接来源于真实总体。
9.4 一元线性回归模型的检验
9.4.1 模型估计式检验的必要性
第 9 章
模型参数估计值的经济意义检验,是对模型参数估计值在理论上能否成立进行判别。经济意义检验又称符号检验,依据模型参数估计值的符号(正号或负号)及取值的大小,评判其是否符合经济理论的规定或社会经济实践的常规。如果模型参数估计值符号和大小符合经济理论的规定或经济实践的常规,表明它在理论上有依据或在实践中能够被验证,可以成立。如果模型参数估计值符号和大小不符合经济理论的规定或违背经济实践的常规,表明它缺乏理论依据和实践证明,不能成立。没有理论依据又不被经济活动实践证明的模型参数估计值,在一般情况下是不正确的,不应被接受。
9.4 一元线性回归模型的检验
9.4.2 模型参数估计值的经济意义检验
第 9 章
在某种意义上,OLS的样本回归线是离所有样本点最近的直线。但此最近的直线究竟离这些样本点有多近,希望有绝对的度量,以衡量样本回归线对数据的拟合优良程度,即拟合优度。拟合优度是在总离差分解的基础上确定样本决定系数或可决系数去度量的。
1.总离差的分解
2.样本决定系数
3.估计标准误
9.4 一元线性回归模型的检验
9.4.3 回归直线的拟合优度
第 9 章
1.总离差的分解
为了说明样本决定系数的意义,首先考察一下总离差的组成情况。由残差的定义可知 。以平均值 为基准,说明 对 的偏离程度,如图9-7所示。
9.4 一元线性回归模型的检验
9.4.3 回归直线的拟合优度
图9-7 被解释变量离差分解
第 9 章
2.样本决定系数
在总离差中,由x解释的离差越大,则 就越小,各观测值聚集在回归直线周围的紧密程度越大,说明直线与观测值的拟合程度越好。如果将SST=SSR+SSE两边同时除以SST,得到:
或者
9.4 一元线性回归模型的检验
9.4.3 回归直线的拟合优度
第 9 章
3.估计标准误
决定系数可用于度量回归直线的拟合程度,相关系数也可以起到类似的作用。而残差平方和则可以说明实际观测值 与 回归估计值之间的差异程度。估计标准误差就是度量各实际观测点在直线周围的散布状况的一个统计量,它是均方残差(MSE)的平方根,用 来表示,其计算公式为∶
9.4 一元线性回归模型的检验
9.4.3 回归直线的拟合优度
第 9 章
【例】利用表9-2的数据,求销售额对广告费的线性回归的估计标准误差,并解释其含义。
解:利用表9-1的数据,根据Stata输出的回归结果,可知SSE=6.034。
根据公式得到:
实际上Stata输出的回归结果中直接给出了该值,即标准误差为1.002 8。这就是说,根据广告费来估计销售额时,平均的估计误差为1.002 8万元。
9.4 一元线性回归模型的检验
9.4.3 回归直线的拟合优度
第 9 章
假设检验是统计推断的一个主要内容,它的基本任务是根据样本所提供的信息,对未知总体分布的某些方面的假设做出合理的判断。
1.假设检验的基本原理
2.回归系数的检验
9.4 一元线性回归模型的检验
9.4.4 回归系数的显著性检验
第 9 章
1.假设检验的基本原理
假设检验的基本思路是首先对总体参数值提出假设,然后再利用样本提供的信息去验证先前提出的假设是否成立。如果样本数据不能够充分证明和支持假设的成立,则在一定的概率条件下,应拒绝该假设;相反,如果样本数据不能够充分证明和支持假设是不成立的,则不能推翻假设成立的合理性和真实性。
假设检验大致有如下步骤。
(1)提出假设。
(2)构建检验统计量的分布并计算出检验统计量的值。
(3)做出决策。
9.4 一元线性回归模型的检验
9.4.4 回归系数的显著性检验
第 9 章
2.回归系数的检验
回归系数的显著性检验是要检验解释变量对被解释变量的影响是否显著。在一元线性回归模型中,如果回归系数 =0,则回归线是一条水平线,表明被解释变量y的取值不依赖于解释变量x,即两个变量之间没有线性关系;如果回归系数 ≠0,也不能得出两个变量之间存在线性关系的结论,要看这种关系是否具有统计意义上的显著性。回归系数的显著性检验就是检验回归系数 是否等于0。
为检验原假设: 是否成立,需要构造用于检验的统计量。为此,需要研究回归系数的 抽样分布。
9.4 一元线性回归模型的检验
9.4.4 回归系数的显著性检验
第 9 章
回归系数的显著性检验的具体步骤如下。
第1步∶提出假设。 ∶ =0; ∶ ≠0。
第2步∶计算检验统计量t。
第3步∶做出决策。确定显著性水平 ,并根据自由度df=n-2查t分布表,找到相应的临界值 。若 则拒绝 ,回归系数等于0的可能性小于 ,表明解释变量x对被解释变量y的影响是显著的,换言之,两个变量之间存在着显著的线性关系;若 ,则不拒绝 ,没有证据表明x对y的影响显著,或者说,两者之间尚不存在显著的线性关系。
9.4 一元线性回归模型的检验
9.4.4 回归系数的显著性检验
第 9 章
回归模型经过各种检验并证实符合预定的要求后,就可以利用它来预测被解释变量了。所谓预测是指通过解释变量x的取值来预测被解释变量y的取值。
9.5.1 点估计
9.5.2 区间估计
9.5 一元线性回归模型的预测
第 9 章
利用估计的回归方程,对于x的一个特定值 ,求出y的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。
平均值的点估计是利用估计的回归方程,对于x的一个特定值 ,求出y的平均值的一个估计值 E( )。
个别值的点估计是利用估计的回归方程,对于x的一个特定值 ,求出y的一个个别值的估计值 (一个新的y值)。
9.5 一元线性回归模型的预测
9.5.1 点估计
第 9 章
利用估计的回归方程,对于x的一个特定值 ,求出y的一个估计值的区间就是区间估计。区间估计也有两种类型:一是置信区间估计,它是对x的一个给定值 ,求出y的平均值的估计区间,这一区间称为置信区间;二是预测区间估计,它是对x的一个给定值 ,求出y的一个个别值的估计区间,这一区间称为预测区间。
1.y的平均值的置信区间估计
2.y的个别值的预测区间估计
9.5 一元线性回归模型的预测
9.5.2 区间估计
图9-8 回归分析的区间估计
第 9 章
1.y的平均值的置信区间估计
置信区间估计是对x的一个给定值 ,求出y的平均值的区间估计。
设x0为解释变量x的一个特定值或给定值; E( )为给定 时被解释变量y的平均值或期望值。当 时, 为E( )的估计值。
一般来说,不能期望估计值 精确地等于E( )。因此,要想用 推断 E( ),必须考虑根据估计的回归方程得到的 的方差。对于给定的 ,统计学家给出了估计了 的标准差的公式,用 表示 的标准差的估计量,其计算公式为∶
有了 的标准差之后,对于给定的 , E( )在1- 置信水平下的置信区间可表示为:
9 一元线性回归模型的预测
9.5.2 区间估计
第 9 章
【例】根据估计方程,当企业花30万元做广告时,求出年均销售额的95%的置信区间。
解:根据前面的计算可知 。
当广告费为30万元时,年均销售额的点估计值为:
E( ) = 4.640+1.078×30=36.98(万元)
当 =30时,根据公式 得出 的置信区间为:
即35.74 38.22。这说明当广告费为30万元时,销售额的平均值在35.74万元~38.22万元之间。
9.5 一元线性回归模型的预测
9.5.2 区间估计
第 9 章
2.y的个别值的预测区间估计
预测区间估计是对x的一个给定值 ,求出y的一个个别值的区间估计。
为求出预测区间,首先必须知道用于估计的标准差。统计学家给出了y的一个个别值 的标准差的估计量,用 表示,其计算公式为∶
因此,对于给定的 ,y的一个个别值 在1- 置信水平下的预测区间可表示为∶
9.5 一元线性回归模型的预测
9.5.2 区间估计
第 9 章
【例】根据估计方程,当企业下一年花30万元做广告时,求出下一年销售额的95%的预测区间。
解:根据前面的计算可知 。
当下一年的广告费为30万元时,该年销售额的点估计值为:
= 4.640+1.078×30=36.98(万元)
当 =30时,根据公式(9-30),得出 的预测区间为:
即34.23 39.73。这说明当下一年的广告费为30万元时,企业的销售额在34.23万元~39.73万元之间。
9.5 一元线性回归模型的预测
9.5.2 区间估计
第 9 章
9.6.1 相关分析的Stata软件操作
9.6.2 回归分析的Stata操作
9.6 用Stata软件进行相关分析和回归分析
第 9 章
Pearson相关系数命令:correlate(简写:cor或corr)[varlist] [if] [in] [weight] [,options]。
Spearman相关系数命令:spearman [varlist], stats(rho p)。
在Stata中,命令corr用于计算一组变量间的协方差或相关系数矩阵;命令pwcorr可用于计算一组变量中两两变量的相关系数,同时还可以对相关系数的显著性进行检验;在options选项中加上sig可显示显著性水平,即pwcorr [varlist] ,sig。
9.6 用Stata软件进行相关分析和回归分析
9.6.1 相关分析的Stata软件操作
第 9 章
regress命令可以用来完成因变量对自变量的回归,Stata为我们输出的结果除了系数的估计量外,还包括系数的标准差、t值、P值和95%的置信区间。
regress命令的格式如下∶
.regress depvar indepvars [if][in][weight] [,options]
其中depvar表示因变量,indepvars表示自变量in 和 if用于选择样本或者选择范围,weight用于添加权重。常用的选项(options)有:noconstant不加常数项做线性回归;hascons由用户指定常数项的值;level(#)设定置信水平(默认值为 95%);beta报告标准化的beta 系数;noheader不报告输出表名。
9.6 用Stata软件进行相关分析和回归分析
9.6.2 回归分析的Stata操作
第 9 章
一元线性回归分析
思考与练习
1.从某行业中随机抽取12家企业,所得产量与生产费用的数据如下。
企 业 编 号 产量(台) 生产费用(万元) 企 业 编 号 产量(台) 生产费用(万元)
1 40 130 7 84 165
2 42 150 8 100 170
3 50 155 9 116 167
4 55 140 10 125 180
5 65 150 11 130 175
6 78 154 12 140 185
要求:
(1)绘制产量与生产费用的散点图,判断两者之间的关系形态;
(2)计算产量与生产费用之间的线性相关系数;
(3)对相关系数的显著性进行检验(α=0.05),并说明两者之间的关系强度。

展开更多......

收起↑

资源预览