4.3.1.2 相关系数与非线性回归 课件(22页) 2025-2026学年人教B版2019高中数学选择性必修第二册

资源下载
  1. 二一教育资源

4.3.1.2 相关系数与非线性回归 课件(22页) 2025-2026学年人教B版2019高中数学选择性必修第二册

资源简介

(共22张PPT)
4.3.1.2 相关系数与非线性回归
第四章
1.结合具体实例,了解样本相关系数的统计含义.
2.了解非线性回归的概念,会将非线性相关关系转化为线性相关关系.
通过散点图可以判断两个变量之间有无相关关系,但散点图不能准确反映变量之间的关系强度. 因此,需要引入一个统计量――相关系数.
一般地,对n个成对观测数据(x1,y1), (x2,y2),…, (xn,yn),我们用{xi}表示数据x1, x2,…, xn; {yi}表示数据y1, y2,…, yn.
用 分别表示{xi}与{yi}的均值.
用 分别表示{xi}与{yi}的标准差.

则当sxsy≠0时,我们称 为变量x与变量y的相关系数.
注意,相关系数也可以这样计算:
下图分别是{xi}和{yi}之间正相关和负相关的例子,其中样本量都是50.
相关系数 rxy=0.4
相关系数 rxy=0.8
相关系数 rxy=0.95
相关系数 rxy=-0.4
相关系数 rxy=-0.8
相关系数 rxy=-0.95
相关系数具有以下性质:
(3) |r|=1的充要条件是成对数据构成的点都在回归直线上.
(1) y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0.
(2)|r|≤1
当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱.
统计经验告诉我们,当rxy>0.8时,y有随着x的增加而增加的趋势,这时我们认为{xi}和{yi}是高度正相关的;当rxy<-0.8时,y有随着x的增加而减少的趋势,这时我们称{xi}和{yi}是高度负相关的.
例1 互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:
据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若|r|>0.8,则可认为y与x有较强的线性相关关系)
日期 1日 2日 3日 4日 5日
外卖甲日接单:x(百单) 5 2 9 8 11
外卖乙日接单:y(百单) 2 3 10 5 15
解:
问题:人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.
以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图.
编号 1 2 3 4 5 6 7 8
年份 1896 1912 1921 1930 1936 1956 1960 1968
记录/s 11.80 10.60 10.40 10.30 10.20 10.10 10.00 9.95
在左图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.
用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性回归模型来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经验回归方程为:
将经验回归直线叠加到散点图,得到下图:

追问1:从图中可以看到,经验回归方程①较好地刻画了散点的变化趋势.请再仔细观察图形,你能看出其中存在的问题吗?
追问1:从图中可以看到,经验回归方程①较好地刻画了散点的变化趋势.请再仔细观察图形,你能看出其中存在的问题吗?
以经验回归直线为参照,可以发现经验回归方程的不足之处,以及散点的更为精细的分布特征,例如,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.
仔细观察上图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近。
追问2:你能对模型进行修改,以使其更好地反映散点的分布特征吗?
回顾已有的函数知识,可以发现函数y=-lnx的图象具有类似的形状特征.
注意到100m短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线y=f(t)=c1+c2ln(t-1895)的周围,其中c1、c2为未知参数,且c2<0.
y=f(t)=c1+c2ln(t-1895)
这是一个非线性经验回归函数,如何利用成对数据估计参数c1、c2
令x=ln(t-1895),则Y=c2x+c1
编号 1 2 3 4 5 6 7 8
年份/t 1896 1912 1921 1930 1936 1956 1960 1968
x 0.00 2.83 3.26 3.56 3.71 4.11 4.17 4.29
记录/s 11.80 10.60 10.40 10.30 10.20 10.10 10.00 9.95
对数据进行变化可得下表:
得到散点图如下:
*
由表中的数据得到经验回归方程为:
经验回归方程(*)对于成对数据具有非常好的拟合精度.
将x=ln(t-1895)代入:
上述y与x的关系,因为不再是线性相关关系,所以称为非线性相关关系,所得到的方程称为非线性回归方程(也简称为回归方程).
常见非线性模型及其线性化的方法
(1)指数函数y=αeβx(α>0)
β>0
β<0
处理方法:
两边取自然对数,得lny=lnα+βx,令y =lny,x =lnx,则y =lnα+βx
归纳总结
(2)幂函数y=αxβ(α>0)
β>0
β<0
(3)对数函数y=α+βlogax
0<β<1
β>1
-1<β<0
β<-1
处理方法:
两边取自然对数,得lny=lnα+βlnx,令y =lny,x =lnx,则y =lnα+βx .
处理方法:
令x =logax,则y =α+βx .
根据本节课所学,回答下列问题:
1.线性相关系数r的公式是什么?r有哪些性质?
2.非线性模型如何转化为线性模型?
1.甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r,如表:
则哪位同学的试验结果体现两变量有更强的线性相关性?( )
A. 甲 B. 乙 C. 丙 D. 丁
甲 乙 丙 丁
r -0.82 0.78 0.69 0.87
D
D

展开更多......

收起↑

资源预览