资源简介 (共41张PPT)北师大版 数学 选择性必修第一册课标定位素养阐释 1.结合实例,了解样本相关系数的统计含义.2.了解样本相关系数与标准化数据向量夹角的关系.3.结合实例,会通过样本相关系数比较多组成对数据的相关性.4.通过标准化数据向量的夹角余弦值推导样本相关系数公式,体现数学抽象素养.5.通过计算多组成对数据的样本相关系数,加强数学运算素养.自主预习 新知导学相关系数【问题思考】1.给定两个随机变量(X,Y)的6组成对数据:(-2,4),(-1,1),(0,0),(1,1),(2,4),(3,9).(1)请利用最小二乘法,求Y关于X的线性回归方程.(2)请画出散点图,判断随机变量X和Y是否具有线性关系.提示:如答图7-2-1.从散点图发现,X和Y不具有线性关系.答图7-2-1(3)有的散点图的各点并不集中在一条直线的附近,但按照求线性回归方程的步骤仍然求得回归直线,那么这样的回归直线有没有实际意义呢 在怎样的情况下求得的线性回归方程才有实际意义呢 提示:没有,需要对X,Y的线性相关性进行检验,在具有线性相关的前提下求得的线性回归方程才有实际意义.(3)样本(线性)相关系数r的性质:①r的取值范围: [-1,1] .②|r|值越接近 1 ,随机变量之间的线性相关程度越强;|r|值越接近 0 ,随机变量之间的线性相关程度越弱.③当r>0时,两个随机变量的值总体上变化趋势 相同 ,此时称两个随机变量正相关;当r<0时,两个随机变量的值总体上变化趋势 相反 ,此时称两个随机变量 负相关;当r=0时,此时称两个随机变量 线性不相关 .答案:0【思考辨析】判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.(1)通过散点图一定可以看出两个变量之间的线性相关性强弱.( )(2)通过散点图可以看出正相关与负相关有明显的区别.( )(3)两个随机变量之间的线性相关程度越强,样本相关系数r越接近1.( )(4)在散点图中,若点散布在从左下角到右上角的区域,则这两个随机变量正相关.( )(5)样本相关系数r可以定量地反映出变量间的线性相关程度,明确地给出有无必要建立两变量间的线性回归方程.( )×√×√√合作探究 释疑解惑探究一判断两变量间的相关性【例1】为了研究钢铁碳含量与电阻的关系,随机抽取了7组数据,如表7-2-1:(1)画出散点图,判断碳含量与电阻之间的相关性;碳含量/% 0.10 0.30 0.40 0.55 0.70 0.80 0.9520℃时电阻/μΩ 15 18 19 21 22.6 23.8 26表7-2-1分析:(1)以x轴表示碳含量,y轴表示电阻,作出散点图直观判断.(2)利用公式计算样本相关系数r,用|r|与0或1比较,进而作出判断.解:(1)画出散点图如答图7-2-2.由散点图可以看出,这些点大致分布在一条直线的附近,具有很强的正相 关性.答图7-2-2(2)列表如下:1.判断两个变量之间的线性关系的方法:一是用散点图直观观察,二是计算样本相关系数r,|r|值越接近1,随机变量之间的线性相关程度越强.准确的判断方法是先用散点图定性分析,再用样本相关系数r进行定量研究.2.利用样本相关系数r判断相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器,计算应该特别细心,不能出现计算错误.【变式训练1】 表7-2-2是随机抽取的8对母女的身高数据,试根据这些数据探讨Y与X之间的关系.表7-2-2母亲身高X/cm 154 157 158 159 160 161 162 163女儿身高Y/cm 155 156 159 162 161 164 165 166解:以x轴表示母亲身高,y轴表示女儿身高,可得相应的散点图,如答图7-2-3.由散点图可知,母亲身高和女儿身高之间有很强的正相关性.答图7-2-3下面计算样本相关系数r,列表如下:探究二利用样本相关系数进行线性回归分析【例2】 已知某地每单位面积菜地年平均施用氮肥量X(单位:kg)与每单位面积蔬菜年平均产量Y(单位:t)的数据如表7-2-3:(1)求X与Y之间的样本相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量Y与施用氮肥量X之间的线性回归方程,并估计每单位面积菜地年平均施氮肥150 kg时,每单位面积蔬菜的年平均产量.表7-2-3年份 2008 2009 2010 2011 2012 2013 2014 2015X/kg 70 74 80 78 85 92 90 95Y/t 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0年份 2016 2017 2018 2019 2020 2021 2022 —X/kg 92 108 115 123 130 138 145 —Y/t 11.5 11.0 11.8 12.2 12.5 12.8 13.0 —解:(1)列出下表,并用科学计算器进行相关计算:所以线性回归方程为Y=0.646 3+0.093 7X.所以当每单位面积菜地年平均施氮肥150 kg时,估计每单位面积蔬菜的年平均产量为0.646 3+0.093 7×150≈14.701(t).在研究两个变量之间的关系时,应先进行相关性检验,若具备线性相关关系,则再求线性回归方程.若本身两个变量不具备线性相关关系,则即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.【变式训练2】为了分析学生初中升学的数学成绩对高一数学学习的影响,在高一年级随机抽取10名学生,了解他们的入学数学成绩和高一期末考试数学成绩如表7-2-4: 表7-2-4学生编号 1 2 3 4 5 6 7 8 9 10入学数学成绩X 63 67 45 88 81 71 52 99 58 76高一期末考试数学成绩Y 65 78 52 82 92 89 73 98 56 75(1)画出散点图;(2)对变量X与Y进行相关性检验,如果X与Y之间具有线性相关关系,求出线性回归方程;(3)若某学生入学的数学成绩为80分,试估计他在高一期末考试中的数学成绩.解:(1)散点图如答图7-2-4.答图7-2-4(3)若某学生入学的数学成绩为80分,代入(2)中的方程可求得Y=22.410 8+0.765 56×80≈84,即这名学生在高一期末考试中的数学成绩的预测值为84分.思想方法数形结合思想在线性回归分析中的应用【典例】 某地10户家庭的年收入和年饮食支出的统计资料如表7-2-5所示. 表7-2-3年收入X/万元 2 4 4 6 6 6 7 7 8 10年饮食支出Y/万元 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3根据表中数据,判断两个变量是否线性相关,计算样本相关系数,并刻画它们的相关程度.分析:先画出散点图,观察散点图,可以看出样本点都集中在一条直线的附近,由此可以判定家庭的年收入和年饮食支出线性相关.解:作散点图如图7-2-1.图7-2-1由散点图可知家庭的年收入和年饮食支出之间存在近似的线性关系.根据样本相关系数的定义,随堂练习1.(多选题)下面的各图中,散点图与样本相关系数r符合的有( ).解析:对于A,散点图上所有点都在一条斜率小于0的直线上,所以样本相关系数r=-1,A正确;对于B,散点图上所有点都在一条斜率大于0的直线上,所以样本相关系数r=1,B错误;对于C,散点图上所有点从左到右是向下的带状分布,所以样本相关系数-1答案:ACD答案:A3.为考虑广告费用X(单位:万元)与销售额Y(单位:万元)之间的关系,抽取了5家餐厅,得到如下数据:则X与Y之间的样本相关系数为 .(结果精确到0.000 1) 广告费用X/万元 1.0 4.0 6.0 10.0 14.0销售额Y/万元 19.0 44.0 40.0 52.0 53.0答案:0.858 84.某市2018~2022年居民家庭平均年收入X(单位:万元)与平均年支出Y(单位:万元)的统计资料如下表所示.年份 2018 2019 2020 2021 2022平均年收入X 11.5 12.1 13 13.3 15平均年支出Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭平均年收入的中位数是 ,家庭平均年收入与平均年支出的样本相关系数r= (结果精确到0.01). 解析:按照中位数的定义,将5个数据按从小到大的顺序排列,则中间一个数是中位数,即中位数为13.答案:13 0.97 展开更多...... 收起↑ 资源预览