北师大版高中数学选择性必修第一册第七章统计案例7.2成对数据的线性相关性教学课件(共41张PPT)

资源下载
  1. 二一教育资源

北师大版高中数学选择性必修第一册第七章统计案例7.2成对数据的线性相关性教学课件(共41张PPT)

资源简介

(共41张PPT)
北师大版 数学 选择性必修第一册
课标定位
素养阐释 1.结合实例,了解样本相关系数的统计含义.
2.了解样本相关系数与标准化数据向量夹角的关系.
3.结合实例,会通过样本相关系数比较多组成对数据的相关性.
4.通过标准化数据向量的夹角余弦值推导样本相关系数公式,体现数学抽象素养.
5.通过计算多组成对数据的样本相关系数,加强数学运算素养.
自主预习 新知导学
相关系数
【问题思考】
1.给定两个随机变量(X,Y)的6组成对数据:(-2,4),(-1,1),(0,0),(1,1),(2,4),(3,9).
(1)请利用最小二乘法,求Y关于X的线性回归方程.
(2)请画出散点图,判断随机变量X和Y是否具有线性关系.
提示:如答图7-2-1.从散点图发现,X和Y不具有线性关系.
答图7-2-1
(3)有的散点图的各点并不集中在一条直线的附近,但按照求线性回归方程的步骤仍然求得回归直线,那么这样的回归直线有没有实际意义呢 在怎样的情况下求得的线性回归方程才有实际意义呢
提示:没有,需要对X,Y的线性相关性进行检验,在具有线性相关的前提下求得的线性回归方程才有实际意义.
(3)样本(线性)相关系数r的性质:
①r的取值范围: [-1,1] .
②|r|值越接近 1 ,随机变量之间的线性相关程度越强;|r|值越接近 0 ,随机变量之间的线性相关程度越弱.
③当r>0时,两个随机变量的值总体上变化趋势 相同 ,此时称两个随机变量正相关;
当r<0时,两个随机变量的值总体上变化趋势 相反 ,此时称两个随机变量 负相关;
当r=0时,此时称两个随机变量 线性不相关 .
答案:0
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)通过散点图一定可以看出两个变量之间的线性相关性强弱.(  )
(2)通过散点图可以看出正相关与负相关有明显的区别.(  )
(3)两个随机变量之间的线性相关程度越强,样本相关系数r越接近1.(  )
(4)在散点图中,若点散布在从左下角到右上角的区域,则这两个随机变量正相关.(  )
(5)样本相关系数r可以定量地反映出变量间的线性相关程度,明确地给出有无必要建立两变量间的线性回归方程.(  )
×

×


合作探究 释疑解惑
探究一
判断两变量间的相关性
【例1】为了研究钢铁碳含量与电阻的关系,随机抽取了7组数据,如表7-2-1:
(1)画出散点图,判断碳含量与电阻之间的相关性;
碳含量/% 0.10 0.30 0.40 0.55 0.70 0.80 0.95
20℃时电阻/μΩ 15 18 19 21 22.6 23.8 26
表7-2-1
分析:(1)以x轴表示碳含量,y轴表示电阻,作出散点图直观判断.(2)利用公式计算样本相关系数r,用|r|与0或1比较,进而作出判断.
解:(1)画出散点图如答图7-2-2.
由散点图可以看出,这些点大致分布在一条直线的附近,具有很强的正相 关性.
答图7-2-2
(2)列表如下:
1.判断两个变量之间的线性关系的方法:一是用散点图直观观察,二是计算样本相关系数r,|r|值越接近1,随机变量之间的线性相关程度越强.准确的判断方法是先用散点图定性分析,再用样本相关系数r进行定量研究.
2.利用样本相关系数r判断相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器,计算应该特别细心,不能出现计算错误.
【变式训练1】 表7-2-2是随机抽取的8对母女的身高数据,试根据这些数据探讨Y与X之间的关系.
表7-2-2
母亲身高X/cm 154 157 158 159 160 161 162 163
女儿身高Y/cm 155 156 159 162 161 164 165 166
解:以x轴表示母亲身高,y轴表示女儿身高,可得相应的散点图,如答图7-2-3.由散点图可知,母亲身高和女儿身高之间有很强的正相关性.
答图7-2-3
下面计算样本相关系数r,列表如下:
探究二
利用样本相关系数进行线性回归分析
【例2】 已知某地每单位面积菜地年平均施用氮肥量X(单位:kg)与每单位面积蔬菜年平均产量Y(单位:t)的数据如表7-2-3:
(1)求X与Y之间的样本相关系数,并检验是否线性相关;
(2)若线性相关,求蔬菜产量Y与施用氮肥量X之间的线性回归方程,并估计每单位面积菜地年平均施氮肥150 kg时,每单位面积蔬菜的年平均产量.
表7-2-3
年份 2008 2009 2010 2011 2012 2013 2014 2015
X/kg 70 74 80 78 85 92 90 95
Y/t 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0
年份 2016 2017 2018 2019 2020 2021 2022 —
X/kg 92 108 115 123 130 138 145 —
Y/t 11.5 11.0 11.8 12.2 12.5 12.8 13.0 —
解:(1)列出下表,并用科学计算器进行相关计算:
所以线性回归方程为Y=0.646 3+0.093 7X.所以当每单位面积菜地年平均施氮肥150 kg时,估计每单位面积蔬菜的年平均产量为
0.646 3+0.093 7×150≈14.701(t).
在研究两个变量之间的关系时,应先进行相关性检验,若具备线性相关关系,则再求线性回归方程.若本身两个变量不具备线性相关关系,则即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
【变式训练2】为了分析学生初中升学的数学成绩对高一数学学习的影响,在高一年级随机抽取10名学生,了解他们的入学数学成绩和高一期末考试数学成绩如表7-2-4: 表7-2-4
学生编号 1 2 3 4 5 6 7 8 9 10
入学数学成绩X 63 67 45 88 81 71 52 99 58 76
高一期末考试数学成绩Y 65 78 52 82 92 89 73 98 56 75
(1)画出散点图;
(2)对变量X与Y进行相关性检验,如果X与Y之间具有线性相关关系,求出线性回归方程;
(3)若某学生入学的数学成绩为80分,试估计他在高一期末考试中的数学
成绩.
解:(1)散点图如答图7-2-4.
答图7-2-4
(3)若某学生入学的数学成绩为80分,代入(2)中的方程可求得
Y=22.410 8+0.765 56×80≈84,即这名学生在高一期末考试中的数学成绩的预测值为84分.
思想方法
数形结合思想在线性回归分析中的应用
【典例】 某地10户家庭的年收入和年饮食支出的统计资料如表7-2-5所示. 表7-2-3
年收入
X/万元 2 4 4 6 6 6 7 7 8 10
年饮食支出Y/万元 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3
根据表中数据,判断两个变量是否线性相关,计算样本相关系数,并刻画它们的相关程度.
分析:先画出散点图,观察散点图,可以看出样本点都集中在一条直线的附近,由此可以判定家庭的年收入和年饮食支出线性相关.
解:作散点图如图7-2-1.
图7-2-1
由散点图可知家庭的年收入和年饮食支出之间存在近似的线性关系.
根据样本相关系数的定义,
随堂练习
1.(多选题)下面的各图中,散点图与样本相关系数r符合的有(  ).
解析:对于A,散点图上所有点都在一条斜率小于0的直线上,所以样本相关系数r=-1,A正确;对于B,散点图上所有点都在一条斜率大于0的直线上,所以样本相关系数r=1,B错误;对于C,散点图上所有点从左到右是向下的带状分布,所以样本相关系数-1答案:ACD
答案:A
3.为考虑广告费用X(单位:万元)与销售额Y(单位:万元)之间的关系,抽取了5家餐厅,得到如下数据:
则X与Y之间的样本相关系数为    .(结果精确到0.000 1)
广告费用X/万元 1.0 4.0 6.0 10.0 14.0
销售额Y/万元 19.0 44.0 40.0 52.0 53.0
答案:0.858 8
4.某市2018~2022年居民家庭平均年收入X(单位:万元)与平均年支出Y(单位:万元)的统计资料如下表所示.
年份 2018 2019 2020 2021 2022
平均年收入X 11.5 12.1 13 13.3 15
平均年支出Y 6.8 8.8 9.8 10 12
根据统计资料,居民家庭平均年收入的中位数是     ,家庭平均年收入与平均年支出的样本相关系数r=     (结果精确到0.01).
解析:按照中位数的定义,将5个数据按从小到大的顺序排列,则中间一个数是中位数,即中位数为13.
答案:13 0.97

展开更多......

收起↑

资源预览