资源简介 (共20张PPT)*第十章 回归分析§10.1 一元线性回归本章的主要目的是讨论变量之间的关系。早在十九世纪,英国生物统计学家高尔顿在研究父子身高的遗传关系时,测量了1078对父子的身高,用x表示父亲的身高,用y表示成年儿子的身高(单位:英寸,1英寸=2.54cm),发现这样一个关系式*这表明父亲的身高每增加一个单位,其儿子的身高平均增加0.516个单位;高个子的父辈有生高儿子的趋势,但是一群高个子父辈的儿子们的平均身高要低于父辈的平均身高。如x=80, 则y=75.01;矮个子的父辈有生矮儿子的趋势,但是一群矮个子父辈的儿子们的平均身高要高于父辈的平均身高。如x=60, 则y=64.69。*这便是子代的平均身高有向中心回归的意思。因此讨论变量之间的关系称为回归分析。随着计算机的发展,回归分析的应用越来越广泛。回归分析处理的是变量与变量之间的关系。相互联系的变量间有两种类型:一类是确定的函数关系,例如已知正方形的边长为a,该正方形的面积为A= a2,A与a之间有确定的关系。*另一类是不完全确定性相关,例如某种树的树龄与树高的关系,一般讲树龄长,则树相对较高,这不是绝对的,但在大量的试验和统计中有着相当稳定的规律,这种关系称为统计相关。 它在实际问题中经常出现,臂如讨论价格与销量的关系;身高与体重的关系;作物产量与施肥量、气候的关系;成品的寿命与多种原料质量的关系等等。*本章的目的: 是通过统计相关变量间对应的观察值,找一个确定的函数关系或数学模型来表示这种统计规律性。 即由样本观察值分析探求它所依从的统计规律。把分析探求变量之间关系的方法称为回归方法,回归的结果(即确定的函数关系)称为回归函数。*例10-1 某水库的蓄水量y 与时间t有关,下表(表10-1)是1-7月份的数据记录:时间ti(月份) 1 2 3 4 5 6 7蓄水量yi(亿立方米) 10 9.7 8.1 7.2 7.2 6.1 5.6数据表明,总的趋势是蓄水量随时间增长而减少,若能找到近似描述该关系的回归函数,对于预测和控制有很大的作用。*回归函数的获取可分为三个步骤(1). 确定相关变量间的函数类型,它常从实际经验中得到,所以这种数学表达式也称为经验公式.(2).依据回归标准,确定待定参数得到回归函数.(3).检验和判断建立的回归函数有效性. 第(2)步是本章讲述的重点。*①收集数据一、模型例10-1 某水库的蓄水量y 与时间t有关,下表(表10-1)是1-7月份的数据记录:时间xi(月份) 1 2 3 4 5 6 7蓄水量yi(亿立方米) 10 9.7 8.1 7.2 7.2 6.1 5.6*②画散点图*③观测散点图如果n个点在某直线附近波动,但不完全在一直线上,认为由两部分构成,可得一元线性回归的数学模型:*反映y与x的相关关系回归函数的估计为,回归方程为考虑 ⑴如何根据去估计⑵对回归方程的可信度作检验;⑶回归方程的作用:预测,控制。*二、参数的最小二乘法估计1.准则:记为残差平方和。(一) LSE的求法*2.求法:,又 是 的可微函数,有极值。正规方程组:*从而 代入得得到的LSE为10,bb*回归方程有两种形式:两点。回归直线过*1.3. ,当 时, 与 独立2.(二) 估计量的分布及有关性质*4. 仍服从正态分布,*(1)(2) 相互独立定理 在回归模型下有 展开更多...... 收起↑ 资源预览