第八章 §8.1 成对数据的统计相关性(课件+导学案)

资源下载
  1. 二一教育资源

第八章 §8.1 成对数据的统计相关性(课件+导学案)

资源简介

(共82张PPT)
第八章
<<<
§8.1
成对数据的统计相关性
1.会通过收集现实问题中两个有关联变量的数据作出散点图,能利用散点图直观认识变量间的相关关系.
2.会求样本相关系数r,并能利用样本相关系数r判断两个随机变量线性相关程度的大小.
学习目标
“瑞雪兆丰年”是一句流传比较广的农谚,它的意思是适时的冬雪预示着来年是丰收之年,是来年庄稼获得丰收的预兆.但是冬天下几场大雪,来年一定会获得丰收吗?
导 语
一、相关关系的概念
二、散点图与变量的相关关系
随堂演练
三、样本相关系数
四、样本相关系数的实际应用
内容索引
课时对点练

相关关系的概念
下列两个变量是否具有函数关系?
(1)球的面积与半径的关系;
(2)人的身高和体重的关系;
(3)角度和它的余弦值的关系;
(4)父母的身高和子女的身高的关系.
问题1
提示 (1)(3)是函数关系;(2)(4)不是函数关系.
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为 关系.
相关
相关关系与函数关系的异同点
注 意 点
<<<
关系 项目 函数关系 相关关系
相同点 都是两个变量间的关系
不同点 是一种确定关系 是一种非确定关系
是一种因果关系 不一定是因果关系,也可能是伴随关系
 (多选)下列两个变量存在相关关系的为
A.扇形的半径与面积之间的关系
B.降雪量与交通事故的发生率之间的关系
C.人的身高与体重之间的关系
D.家庭的支出与收入之间的关系
例 1

扇形的半径与面积之间的关系是函数关系,其余均为相关关系.


函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系, 而相关关系不一定是因果关系,也可能是伴随关系.




 (多选)下列说法正确的是
A.闯红灯与交通事故发生率的关系是相关关系
B.同一物体的加速度与作用力的关系是函数关系
C.产品的成本与产量的关系是函数关系
D.广告费用与销售量的关系是相关关系
跟踪训练 1

闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,所以A正确;
物体的加速度与作用力的关系是函数关系,所以B正确;
产品的成本与产量之间是相关关系,所以C错误;
广告费用与销售量之间是相关关系,所以D正确.



散点图与变量的相关关系
1.散点图:为了更加直观地描述成对样本数据中两个变量之间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
2.从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现______的趋势,我们就称这两个变量 相关;当一个变量的值增加时,另一个变量的相应值呈现 的趋势,则称这两个变量 相关.

增加
减小

3.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在__________附近,我们就称这两个变量 相关.
4.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
一条直线
线性
 某个男孩的年龄与身高的统计数据如表所示:
例 2
年龄x(岁) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)画出散点图;
散点图如图所示.
(2)判断y与x是否具有线性相关关系,如果相关,是正相关还是负相关?
由散点图知,所有散点分布在一条直线附近,因此,认为y与x具有线性相关关系,且是正相关关系.




判断两个变量x和y是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
下面是水稻产量与施化肥量的一组观测数据:
跟踪训练 2
施化肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(1)将上述数据制成散点图;
散点图如图.
(2)你能从散点图中发现施化肥量与水稻产量存在什么关系吗?水稻产量会一直随施化肥量的增加而增加吗?
从图中可以发现,当施化肥量由小到大变化时,水稻产量也由小变大,图中的散点大致分布在一条直线的附近,因此施化肥量和水稻产量线性相关,但水稻产量只是在一定范围内随着施化肥量的增加而增加,不会一直随施化肥量的增加而增加.

样本相关系数
提示 散点图(略),发现正相关时关于均值平移后的散点大多数分布在第一象限、第三象限,负相关时关于均值平移后的散点大多数分布在第二象限、第四象限.构造一个量:
Lxy=[(x1-)(y1-)+(x2-)(y2-)+…+(xn-)(yn-)].
一般情形下,Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.
设x1, x2,…,xn和y1,y2,…,yn的均值分别为和.将每个变量的观测数据减去其均值,得到成对数据为(x1-,y1-),(x2-,y2-),…,(xn-,yn-),并绘制散点图,则绘制的散点图有什么特征?你能利用正负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
问题2
提示 不一定.因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.
你认为Lxy的大小一定能度量出成对样本数据的相关程度吗?
问题3
1.样本相关系数:r==.
2.样本相关系数r的取值范围为 .
当|r|越接近1时,成对样本数据的线性相关程度越 ;
当|r|越接近0时,成对样本数据的线性相关程度越 .
[-1,1]


样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关;
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
注 意 点
<<<
 对四组成对样本数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是
A.r2B.r4C.r4D.r2例 3

由给出的四组成对样本数据的散点图可以看出,题图1和题图3是正相关,样本相关系数大于0,题图2和题图4是负相关,样本相关系数小于0,题图1和题图2的样本点集中在一条直线附近,所以相关程度更强,所以r1接近于1,r2接近于-1,由此可得r2



(1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关程度越强.
(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关程度越强.
线性相关程度强弱的判断方法
 已知r1表示变量X与Y之间的样本相关系数,r2表示变量U与V之间的样本相关系数,且r1=0.837,r2=-0.957,则
A.变量X与Y之间呈正相关关系,且X与Y之间的相关程度强于U与V之间
的相关程度
B.变量X与Y之间呈负相关关系,且X与Y之间的相关程度强于U与V之间
的相关程度
C.变量U与V之间呈负相关关系,且X与Y之间的相关程度弱于U与V之间
的相关程度
D.变量U与V之间呈正相关关系,且X与Y之间的相关程度弱于U与V之间
的相关程度
跟踪训练 3

因为r1=0.837>0,r2=-0.957<0,所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,因为|r1|<|r2|,所以X与Y之间的相关程度弱于U与V之间的相关程度.

样本相关系数的实际应用
 根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示.
依据散点图可以看出,变量x与y线性相关,请计算y与x的样本相关系数r并推断变量x与y的相关程度(若r>0.75,则线性相关程度很强).
例 4
附:样本相关系数r=
=.
由所给数据可得==5,==5,
(xi-)(yi-)=(-3)×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,
=(-3)2+(-1)2+02+12+32=20,
=(-2)2+(-1)2+02+12+22=10,
∵r===>0.75.
∴变量x与y的线性相关程度很强.




(1)当|r|越接近1时,两个变量的相关程度越强,当|r|越接近0时,两个变量的相关程度越弱.
(2)样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.
  为了监控某种零件的一条生产线的生产过程,检验员每隔30 min
从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
跟踪训练 4
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=yi=9.97,≈0.85,
≈18.439,(i-8.5)(yi-)=-2.78,其中yi为抽取的第i个零件的尺寸,i=1,2,…,16.
求的样本相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(结果精确到0.01)
附:样本的样本相关系数r=.
=×(1+2+3+…+16)=8.5,由样本数据得的样本相关系数为r=≈≈-0.18.
由于<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
1.知识清单:
(1)相关关系的概念.
(2)散点图与变量的相关关系.
(3)样本相关系数及其实际应用.
2.方法归纳:数形结合.
3.常见误区:样本相关系数绝对值的大小与相关程度的关系.
随堂演练

1
2
3
4
1.下列两个变量存在相关关系的是
A.利息与利率 B.居民收入与储蓄存款
C.电视机产量与苹果产量 D.某种商品的销售额与销售价格

选项A中的两个变量具有函数关系;
选项B中居民收入与储蓄存款具有相关关系,一般来说,居民收入越高对应的储蓄存款越多;
选项C中的电视机产量与苹果产量无任何关系;
选项D中某种商品的销售额与销售价格具有函数关系.
2.某商场五天内某种T恤衫的销售情况如表:
1
2
3
4
第x天 1 2 3 4 5
销售量y(件) 19 39 59 79 104
则下列说法正确的是
A.y与x负线性相关 B.y与x正线性相关
C.y与x不相关 D.y与x成正比例关系

1
2
3
4
根据表格中的数据作出散点图如图,
可知所有点分布在一条直线附近,
所以y与x是线性相关的,
又y值随着x值的增大而增大,
所以y与x正相关.
3.(多选)对两组数据进行统计后得到的散点图如图,下列关于其样本相关系数的结论正确的是
A.r1<0 B.r2>1
C.r1+r2>0 D.|r1|>|r2|
1
2
3
4


1
2
3
4
由散点图可知,样本相关系数r1的图象表示y与x负相关,故-1样本相关系数r2的图象表示y与x正相关,故1>r2>0,故B错误;
样本相关系数r2的点较样本相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误.
4.在成对样本数据中,已知(xi-)2是 (yi-)2的2倍, (xi-)(yi-)是 (yi-)2的1.2倍,则这组数据的样本相关系数r约为    .(精确
到0.001)
1
2
3
4
0.849
1
2
3
4
r=,
设(yi-)2=a,则(xi-)(yi-)=1.2a,
(xi-)2=2a,故r==≈0.849.
课时对点练

1.下列说法正确的是
A.y=2x2+1中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病病人数是具
有相关关系的两个变量
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
基础巩固

A,B中的两个变量均为函数关系,C,D中的两个变量为相关关系.
2.(多选)关于样本相关系数r,下列说法正确的是
A.r∈[-1,1]
B.若r=0,则两个变量不线性相关
C.若r<0,则一个变量增加,另一个变量有减小的趋势
D.|r|越小,变量之间的线性相关程度越强
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

r∈[-1,1],故A正确;
若r=0,则两个变量不线性相关,故B正确;
若r<0,则一个变量增加,另一个变量有减小的趋势,故C正确;
|r|越大,变量之间的线性相关程度越强,故D错误.


3.(多选)某校地理学兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成如图所示的散点图,则下列说法正确的是
A.沸点与海拔高度正相关
B.沸点与气压正相关
C.沸点与海拔高度负相关
D.沸点与海拔高度、沸点与气压
的线性相关程度都很强

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压正相关,沸点与海拔高度负相关,由于两个散点图中的点都呈现线性分布,所以沸点与海拔高度、沸点与气压的线性相关程度都很强,故B,C,D正确,A错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
4.“吸烟有害健康,吸烟会对身体造成伤害”.相关科学家研究表明,开始吸烟年龄X分别为16岁、18岁、20岁和22岁者,其得肺癌的相对危险度Y依次为15.10,12.81,9.72,3.21;每天吸烟支数U分别为10,20,30者,其得肺癌的相对危险度V分别为7.5,9.5和16.6,用r1表示变量X与Y之间的样本相关系数,用r2表示变量U与V之间的样本相关系数,则下列说法正确的是
A.r1=r2 B.r1>r2>0
C.0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由题意可知,开始吸烟年龄递增时,得肺癌的相对危险度呈递减趋势,所以吸烟年龄与得肺癌的相对危险度呈负相关,所以r1<0,同理可知,得肺癌的相对危险度与每天吸烟支数呈正相关,所以r2>0.因此可得r1<05.某商家今年上半年每月的人均销售额(单位:千元)与利润率统计表如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
月份 1 2 3 4 5 6
人均销售额 6 5 8 3 4 7
利润率(%) 13.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是
A.利润率与人均销售额正相关
B.利润率与人均销售额负相关
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
作出利润率与人均销售额的
散点图,如图所示.
由散点图可知,利润率与人
均销售额正相关.
6.(多选)在某地区随机抽取了8对母女的身高数据,如表:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
母亲的身高x/cm 154 157 158 159 160 161 162 163
女儿的身高y/cm 155 156 159 162 161 164 165 166
下列说法正确的是
A.8个成对样本数据呈正相关
B.成对样本数据变量x和y的样本相关系数r约为0.963
C.将每个变量的观测数据减去其均值,得到的成对数据(x1-,y1-),
(x2-,y2-),…,(x8-,y8-)与原始成对样本数据相关性不相同
D.用样本相关系数r可以估计总体两个变量的相关系数



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由成对样本数据可得=(154+157+…+163)÷8=159.25,
=(155+156+…+166)÷8=161,
-8=59.5,-8=116,
xiyi-8=80,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
则r==≈0.963,B正确;
由r≈0.963>0,知8个成对样本数据呈正相关,A正确;
对选项C,平移后的成对数据所对应平面直角坐标系中的散点图与原始的成对样本数据所对应的散点图形状完全一致,故相关性完全相同,C错误;
根据统计学思想,D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
7.已知某个样本点中的变量x,y线性相关,样本相关系数r>0,平移坐标系,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第    象限.
因为r>0,
所以大多数的点都落在第一、三象限.
一、三
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
8.近五年来某草原羊只数量与草地植被指数两变量间的数据如表所示,绘制相应的散点图,如图所示.
年份序号 1 2 3 4 5
羊只数量/万只 1.4 0.9 0.75 0.6 0.3
草地植被指数 1.1 4.3 15.6 31.3 49.7
若利用这五组数据得到的两变量间的样本相关系数为r1,去掉第一年数据(1.4,1.1)后得到的样本相关系数为r2,则r1__________
r2.(填“<”或“>”)
>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
根据散点图可知,羊只数量与草地植被指数呈负相关,则样本相关系数r1<0,r2<0,
当去掉第一年数据(1.4,1.1)后,数据的线性相关程度变强,所以|r1|<|r2|,所以r1>r2.
9.以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
房屋大小x/m2 115 110 80 135 105
销售价格y/万元 24.8 21.6 18.4 29.2 22
(1)画出数据的散点图;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
画出散点图如图所示.
(2)求样本相关系数r,并作出评价.(精确到0.01,已知=60 975,=2 756.8, xiyi=12 952)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
==109,
==23.2,
r===≈0.96,
由此可知,新房屋的销售价格和房屋的大小这两个变量正线性相关,且相关程度很强.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10.某生物小组为了研究温度对某种酶的活性的影响进行了一组试验,试验数据经整理得到如下的折线图:
由图可以看出,这种酶的活性指标值y与温度x具有较强的线性相关关系,请用样本相关系数加以说明.
附: (xi-)(yi-)=85,=5.5,≈2.65,
样本相关系数r=.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由题意得=×(8+11+14+20+23+26)=17,
(xi-)2=(8-17)2+(11-17)2+(14-17)2+(20-17)2+
(23-17)2+(26-17)2=252,
∴r===≈0.97,
由此可得酶的活性指标值y与温度x具有较强的线性相关关系.
11.在一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn互不相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x-5上,则这组成对样本数据的样本相关系数为
A.- B. C.-1 D.1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

综合运用
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由题意可知,所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x-5上,
则这组样本数据完全正相关,样本相关系数为1.
12.已知四组不同数据的两变量的样本相关系数r如下:数据组①的样本相关系数r1=0;数据组②的样本相关系数r2=-0.95;数据组③的样本相关系数|r3|=0.89;数据组④的样本相关系数r4=0.75.则下列说法正确的是
A.数据组①对应的样本点都在一条直线上
B.数据组②中的两变量线性相关程度最强
C.数据组③中的两变量线性相关程度最强
D.数据组④中的两变量线性相关程度最弱
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
对于A,数据组①的样本相关系数r1=0,故数据组①对应的两变量不线性相关,故A错误;
对于B,C,数据组②的样本相关系数的绝对值=0.95,在4组中绝对值最大,故数据组②中的两变量线性相关程度最强,故B正确,C错误;
对于D,数据组①的样本相关系数r1=0在4组中绝对值最小,故数据组①中的两变量线性相关程度最弱,故D错误.
13.为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
x 5 10 15 20 25
y 103 105 110 111 114
(已知数据:=1 375,=59 051, xiyi=8 285)
A.很强 B.很弱
C.无相关 D.不确定

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
=15,=108.6,
r==≈0.982 6,
故两个变量的线性相关程度很强.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
14.北极冰融是近年来最引人注目的气候变化现象之一.白色冰面融化变成颜色相对较暗的海冰,被称为“北极变暗”现象,21世纪以来,北极的气温变化是全球平均水平的2倍,被称为“北极放大”现象.如图为北极年平均海冰面积(106 km2)与年平均CO2浓度(ppm)统计图.则下列说法正确的是
A.北极年平均海冰面积逐年减少
B.北极年平均海冰面积减少速度不断
加快
C.北极年平均海冰面积与年平均CO2浓度负相关
D.北极年平均海冰面积与年平均CO2浓度正相关

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
对于A,B,由统计图可知北极年
平均海冰面积既有增加又有减少,
故A,B错误;
对于C,D,由统计图可知随着年
平均CO2浓度增加,北极年平均海冰面积总体呈下降趋势,所以北极年平均海冰面积与年平均CO2浓度负相关,故C正确,D错误.
15.互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
拓广探究
1日 2日 3日 4日 5日
外卖甲日接单量x(百单) 5 2 9 8 11
外卖乙日接单量y(百单) 2 3 10 5 15
(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1日 2日 3日 4日 5日
外卖甲日接单量x(百单) 5 2 9 8 11
外卖乙日接单量y(百单) 2 3 10 5 15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由表格中的数据,可得
==7,
==7,
外卖甲的日接单量的方差
==10,
外卖乙的日接单量的方差
==23.6,
1日 2日 3日 4日 5日
外卖甲日接单量x(百单) 5 2 9 8 11
外卖乙日接单量y(百单) 2 3 10 5 15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
因为=<,即外卖甲平均日接单量与外卖乙平均日接单量相同,但外卖甲日接单量波动更小,所以外卖甲比外卖乙的经营状况好.
1日 2日 3日 4日 5日
外卖甲日接单量x(百单) 5 2 9 8 11
外卖乙日接单量y(百单) 2 3 10 5 15
(2)据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关程度强弱进行判断(若|r|>0.75,则可认为y与x有较强的线性相关关系,r值精确到0.001).
参考数据:(xi-)(yi-)=66,
≈77.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
因为r=
≈≈0.857>0.75,
所以可认为y与x之间有较强的线性相关关系.
1日 2日 3日 4日 5日
外卖甲日接单量x(百单) 5 2 9 8 11
外卖乙日接单量y(百单) 2 3 10 5 15[学习目标] 1.会通过收集现实问题中两个有关联变量的数据作出散点图,能利用散点图直观认识变量间的相关关系.2.会求样本相关系数r,并能利用样本相关系数r判断两个随机变量线性相关程度的大小.
一、相关关系的概念
问题1 下列两个变量是否具有函数关系?
(1)球的面积与半径的关系;
(2)人的身高和体重的关系;
(3)角度和它的余弦值的关系;
(4)父母的身高和子女的身高的关系.
知识梳理
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为    关系.
例1 (多选)下列两个变量存在相关关系的为 (  )
A.扇形的半径与面积之间的关系
B.降雪量与交通事故的发生率之间的关系
C.人的身高与体重之间的关系
D.家庭的支出与收入之间的关系
反思感悟 函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系, 而相关关系不一定是因果关系,也可能是伴随关系.
跟踪训练1 (多选)下列说法正确的是 (  )
A.闯红灯与交通事故发生率的关系是相关关系
B.同一物体的加速度与作用力的关系是函数关系
C.产品的成本与产量的关系是函数关系
D.广告费用与销售量的关系是相关关系
二、散点图与变量的相关关系
知识梳理
1.散点图:为了更加直观地描述成对样本数据中两个变量之间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
2.从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现    的趋势,我们就称这两个变量    相关;当一个变量的值增加时,另一个变量的相应值呈现    的趋势,则称这两个变量    相关.
3.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在        附近,我们就称这两个变量    相关.
4.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
例2 某个男孩的年龄与身高的统计数据如表所示:
年龄x(岁) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系,如果相关,是正相关还是负相关?
反思感悟 判断两个变量x和y是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
跟踪训练2 下面是水稻产量与施化肥量的一组观测数据:
施化肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(1)将上述数据制成散点图;
(2)你能从散点图中发现施化肥量与水稻产量存在什么关系吗?水稻产量会一直随施化肥量的增加而增加吗?
三、样本相关系数
问题2 设x1, x2,…, xn和y1,y2,…,yn的均值分别为和.将每个变量的观测数据减去其均值,得到成对数据为(x1-,y1-),(x2-,y2-),…,(xn-,yn-),并绘制散点图,则绘制的散点图有什么特征?你能利用正负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
问题3 你认为Lxy的大小一定能度量出成对样本数据的相关程度吗?
知识梳理
1.样本相关系数:r=
=.
2.样本相关系数r的取值范围为    .
当|r|越接近1时,成对样本数据的线性相关程度越    ;
当|r|越接近0时,成对样本数据的线性相关程度越    .
例3 对四组成对样本数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是 (  )
A.r2B.r4C.r4D.r2反思感悟 线性相关程度强弱的判断方法
(1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关程度越强.
(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关程度越强.
跟踪训练3 已知r1表示变量X与Y之间的样本相关系数,r2表示变量U与V之间的样本相关系数,且r1=0.837,r2=-0.957,则 (  )
A.变量X与Y之间呈正相关关系,且X与Y之间的相关程度强于U与V之间的相关程度
B.变量X与Y之间呈负相关关系,且X与Y之间的相关程度强于U与V之间的相关程度
C.变量U与V之间呈负相关关系,且X与Y之间的相关程度弱于U与V之间的相关程度
D.变量U与V之间呈正相关关系,且X与Y之间的相关程度弱于U与V之间的相关程度
四、样本相关系数的实际应用
例4 根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示.
依据散点图可以看出,变量x与y线性相关,请计算y与x的样本相关系数r并推断变量x与y的相关程度(若r>0.75,则线性相关程度很强).
附:样本相关系数r==.
反思感悟 (1)当|r|越接近1时,两个变量的相关程度越强,当|r|越接近0时,两个变量的相关程度越弱.
(2)样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.
跟踪训练4 为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=yi=9.97,≈0.85,≈18.439,(i-8.5)(yi-)=-2.78,其中yi为抽取的第i个零件的尺寸,i=1,2,…,16.
求的样本相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(结果精确到0.01)
附:样本的样本相关系数r=.
1.知识清单:
(1)相关关系的概念.
(2)散点图与变量的相关关系.
(3)样本相关系数及其实际应用.
2.方法归纳:数形结合.
3.常见误区:样本相关系数绝对值的大小与相关程度的关系.
1.下列两个变量存在相关关系的是 (  )
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
2.某商场五天内某种T恤衫的销售情况如表:
第x天 1 2 3 4 5
销售量y(件) 19 39 59 79 104
则下列说法正确的是 (  )
A.y与x负线性相关
B.y与x正线性相关
C.y与x不相关
D.y与x成正比例关系
3.(多选)对两组数据进行统计后得到的散点图如图,下列关于其样本相关系数的结论正确的是 (  )
A.r1<0 B.r2>1
C.r1+r2>0 D.|r1|>|r2|
4.在成对样本数据中,已知(xi-)2是 (yi-)2的2倍, (xi-)(yi-)是 (yi-)2的1.2倍,则这组数据的样本相关系数r约为    .(精确到0.001)
答案精析
问题1 (1)(3)是函数关系;(2)(4)不是函数关系.
知识梳理
相关
例1 BCD [扇形的半径与面积之间的关系是函数关系,其余均为相关关系.]
跟踪训练1 ABD [闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,所以A正确;物体的加速度与作用力的关系是函数关系,所以B正确;产品的成本与产量之间是相关关系,所以C错误;广告费用与销售量之间是相关关系,所以D正确.]
知识梳理
2.增加 正 减小 负
3.一条直线 线性
例2 解 (1)散点图如图所示.
(2)由散点图知,所有散点分布在一条直线附近,因此,认为y与x具有线性相关关系,且是正相关关系.
跟踪训练2 解 (1)散点图如图.
(2)从图中可以发现,当施化肥量由小到大变化时,水稻产量也由小变大,图中的散点大致分布在一条直线的附近,因此施化肥量和水稻产量线性相关,但水稻产量只是在一定范围内随着施化肥量的增加而增加,不会一直随施化肥量的增加而增加.
问题2 散点图(略),发现正相关时关于均值平移后的散点大多数分布在第一象限、第三象限,负相关时关于均值平移后的散点大多数分布在第二象限、第四象限.构造一个量:
Lxy=[(x1-)(y1-)+(x2-)(y2-)+…+(xn-)(yn-)].
一般情形下,Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.
问题3 不一定.因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.
知识梳理
2.[-1,1] 强 弱
例3 A [由给出的四组成对样本数据的散点图可以看出,题图1和题图3是正相关,样本相关系数大于0,题图2和题图4是负相关,样本相关系数小于0,题图1和题图2的样本点集中在一条直线附近,所以相关程度更强,所以r1接近于1,r2接近于-1,由此可得r2跟踪训练3 C [因为r1=0.837>0,r2=-0.957<0,所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,因为|r1|<|r2|,所以X与Y之间的相关程度弱于U与V之间的相关程度.]
例4 解 由所给数据可得==5,
==5,
(xi-)(yi-)=(-3)×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,
=(-3)2+(-1)2+02+12+32=20,
=(-2)2+(-1)2+02+12+22=10,
∵r===>0.75.
∴变量x与y的线性相关程度很强.
跟踪训练4 解 =×(1+2+3+…+16)=8.5,由样本数据得的样本相关系数为r=
≈≈-0.18.
由于<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
随堂演练
1.B [选项A中的两个变量具有函数关系;选项B中居民收入与储蓄存款具有相关关系,一般来说,居民收入越高对应的储蓄存款越多;选项C中的电视机产量与苹果产量无任何关系;选项D中某种商品的销售额与销售价格具有函数关系.]
2.B [根据表格中的数据作出散点图如图,
可知所有点分布在一条直线附近,
所以y与x是线性相关的,
又y值随着x值的增大而增大,
所以y与x正相关.]
3.AC [由散点图可知,样本相关系数r1的图象表示y与x负相关,故-1r2>0,故B错误;样本相关系数r2的点较样本相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误.]
4.0.849
解析  r=,
设(yi-)2=a,则(xi-)(yi-)=1.2a,
(xi-)2=2a,故r==≈0.849.

展开更多......

收起↑

资源列表