7.2成对数据的线性相关性同步学案

资源下载
  1. 二一教育资源

7.2成对数据的线性相关性同步学案

资源简介

§2 成对数据的线性相关性
2.1 相关系数
2.2 成对数据的线性相关性分析
最新课标 (1)结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系. (2)结合实例,会通过相关系数比较多组成对数据的相关性.
[教材要点]
要点 相关系数
1.样本(线性)相关系数:一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),记r==,称r为随机变量X和Y的样本(线性)相关系数,为了计算的方便,再给出如下式子:r=
状元随笔 (1)计算样本相关系数r,需要求出的量;
①应用公式r=,,.
②应用公式r=
(2)公式的选择:当题目中的数据需要自己一一求出时,两个公式选用哪一个都可以;当题目中的数据已给出时,需通过已给出的数据判断选出哪一个公式方便.另外注意两个公式的相通性,适当时可进行转化.
2.样本相关系数与相关程度
样本(线性)相关系数r的取值范围是[-1,1].
|r|值越接近____,随机变量之间的线性相关程度越强;
|r|值越接近____,随机变量之间的线性相关程度越弱.
当r>0时,两个随机变量的值总体上变化趋势相同,此时称两个随机变量______相关;
当r<0时,两个随机变量的值总体上变化趋势相反,此时称两个随机变量______相关;
当r=0时,此时称两个随机变量线性不相关.
[基础自测]
1.思考辨析(正确的画“√”,错误的画“×”)
(1)散点图是判断两个变量是否相关的一种重要方法和手段.(  )
(2)两个变量的相关系数越大,它们的相关程度越强.(  )
(3)当一个变量的值增加时,另一个变量的值随之减少,则称这两个变量负相关.(  )
(4)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.(  )
2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图(2).由这两个散点图可以判断(  )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
3.已知两个变量负相关,且相关程度很强,则它们的相关系数的大小可能是(  )
A.-0.95 B.-0.13
C.0.15 D.0.96
4.用线性回归模型求得甲、乙、丙3组不同的数据的线性相关系数分别为0.81,-0.98,0.63,其中________(填甲、乙、丙中的一个)组数据的线性相关性最强.
题型一 相关关系的判断
例1 (1)如图所示的散点图分别反映的变量间的相关关系是(  )
A.正相关,负相关,不相关 B.负相关,不相关,正相关
C.负相关,正相关,不相关 D.正相关,不相关,负相关
(2)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是(  )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
方法归纳
判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:当r>0时,两个变量正相关;当r<0时,两个变量负相关.
跟踪训练1 (1)(多选题)如图所示的两个变量不具有相关关系的是(  )
(2)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份 1 2 3 4 5 6
人均销售额 6 5 8 3 4 7
利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是(  )
A.利润率与人均销售额成正相关关系
B.利润率与人均销售额成负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
题型二 线性相关程度的判断
例2 为了对2020年某校期末成绩进行分析,在60分以上的全体同学中随机抽取8位,他们的数学、物理成绩对应如下表:
学生编号 1 2 3 4 5 6 7 8
数学成绩x 68 72 78 81 85 88 91 93
物理成绩y 70 66 81 83 79 80 92 89
用变量y与x的样本相关系数r(精确到0.01)说明物理成绩y与数学成绩x的线性相关程度的强弱,并说明它们的变化趋势特征.
参考数据:=52 957, ≈545.82.
方法归纳
在统计中常用样本相关系数r来衡量两个变量间线性相关程度的强弱.r的范围为[-1,1],r为正时,两个变量正相关;r为负时,两个变量负相关;|r|越接近1,两个变量间线性相关程度越大;|r|越接近0,两个变量间线性相关程度越小.
跟踪训练2 某农场经过观测得到水稻产量和施化肥量的统计数据如表:
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
求水稻产量与施化肥量的相关系数,并判断相关性的强弱.
相关系数及线性回归直线方程系数公式:
参考数据:=7 000,=1 132 725,=87 175.
[课堂十分钟]
1.[多选题]如图所示是由成对样本数据(xi,yi)(i=1,2,…,10)得到的散点图,由散点图可以判断变量x,y具有线性相关关系的是(  )
2.对两个变量x,y的几组观测数据统计如表,则这两个相关变量的关系是(  )
x 10 9 8 7 6 5
y 2 3 3.5 4 4.8 5
A.负相关 B.正相关
C.先正后负相关 D.先负后正相关
3.已知x,y是两个变量,下列四个关系中,x,y呈负相关的是(  )
A.y=x2-1 B.y=-x2+1
C.y=x-1 D.y=-x+1
4.下列说法中正确的是________(填序号).
①变量间的线性相关系数r的取值范围为[-1,1];
②变量间的线性相关系数r的绝对值越接近0,则变量间的线性相关程度越低;
③变量间的相关系数越小,变量间的相关程度越小.
5.现随机抽取了某校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试数学成绩(y),数据如表:
学生号 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108
y 84 64 84 68 69 68 69 46 57 71
请问:这10名学生的两次数学考试成绩是否具有显著的线性相关关系?
2.1 相关系数
2.2 成对数据的线性相关性分析
新知初探·课前预习
要点
2.1 0 正 负
[基础自测]
1.(1)√ (2)× (3)× (4)√
2.解析:由两个散点图的形状判断,x与y负相关,u与v是正相关.故选C.
答案:C
3.解析:相关系数r<0时,成对数据负相关,且|r|越大,两个变量之间的线性相关程度越强.
答案:A
4.解析:|r|越接近1,两个变量的线性相关性越强,而|-0.98|>|0.81|>|0.63|,所以乙组数据的线性相关性最强.
答案:乙
题型探究·课堂解透
例1 解析:(1)对于图(1),图中的点成带状分布,且从左到右上升,两个变量正相关;对于图(2),图中的点杂乱无章,没有明显的规律,两个变量不相关;对于图(3),图中的点成带状分布,且从左到右下降,两个变量负相关.故选D.
(2)观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B.
答案:(1)D (2)B
跟踪训练1 解析:(1)A是确定的函数关系;B中的点大都分布在一条曲线周围;C中的点大都分布在一条直线周围;D中点的分布没有任何规律可言,x,y不具有相关关系.故选AD.
(2)由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.
答案:(1)AD (2)A
例2 解析:==82,
==80,
r=≈=≈0.87>0.
所以物理成绩y与数学成绩x的线性相关程度较强,且呈正相关,它们的变化趋势相同.
跟踪训练2 解析:由已知数据计算可知,=30,≈399.3,
∴相关系数r=≈0.97
由于0.97与1十分接近,所以水稻产量与施化肥量的相关性强.
[课堂十分钟]
1.解析:散点图中的点均匀分布在一条直线附近,故选AD.
答案:AD
2.解析:根据两个变量x,y的几组观测数据统计表知,y随x的增大而减小,所以这两个相关变量负相关.
答案:A
3.解析:根据题意,依次分析选项:对于A,y=x2-1,当x增大时,y的值不一定减小,两个变量不是负相关,不符合题意;对于B,y=-x2-1,当x增大时,y的值不一定减小,两个变量不是负相关,不符合题意;对于C,y=x-1,当x增大时,y的值一定增大,两个变量正相关,不符合题意;对于D,y=-x+1,当x增大时,y的值一定减小,两个变量负相关,符合题意;故选D.
4.解析:根据题意,依次分析,对于①,相关系数r满足|r|≤1,即相关系数r的取值范围为[-1,1],①正确;对于②,根据相关系数的性质知|r|≤1,且|r|越接近1,相关程度越大;|r|越接近0,相关程度越小,则②正确;对于③,当r接近-1时,变量间的相关程度比r接近0时的大,故③错误.
答案:①②
5.解析:= (120+108+…+99+108)=107.8,
= (84+64+…+57+71)=68,
=1202+1082+…+992+1082=116 584,
=842+642+…+572+712=47 384,
=120×84+108×64+…+108×71=73 796,
所以,相关系数为
r=≈0.750 6,
故两次数学考试成绩有显著的线性相关关系.

展开更多......

收起↑

资源预览