4.1 课时2 成对数据的统计相关性(二) 学案(原卷版+解析版) 2023-2024学年高二数学湘教版(2019)选择性必修第二册

资源下载
  1. 二一教育资源

4.1 课时2 成对数据的统计相关性(二) 学案(原卷版+解析版) 2023-2024学年高二数学湘教版(2019)选择性必修第二册

资源简介

4.1 课时2 成对数据的统计相关性(二)
【学习目标】
1.会通过相关系数比较多组成对数据的相关性.(数学抽象)
2.了解样本相关系数与标准化数据向量夹角的余弦之间的关系.(逻辑推理、数据分析)
【自主预习】
1.在许多实际问题中,是否只有一个因素对变量的变化产生影响
2.若我们把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),则这两个向量的紧密程度可以用什么度量
3.能否用向量夹角的大小来判断两组数据的相关程度呢
1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)
(1)回归分析中,若rxy=±1,则说明变量x,y之间具有完全的线性关系. (  )
(2)样本相关系数r的范围是r∈(-∞,+∞). (  )
(3)当两组成对数据对应的向量夹角为90°时,两组数据不相关. (  )
2.某研究者搜集了某种花的一些数据(见下表),试分别判断花瓣长与花枝长之间、花瓣长与花萼长之间的相关关系(结果保留三位小数).
花瓣长x 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35
花枝长y 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13
花萼长z 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16
【合作探究】
探究1 多组成对数据的相关性
新知生成
多组成对数据之间的相关性
一般情况下,我们可以考虑将其分成几个不同的两组数据分别进行相关性分析.
新知运用
例1 根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种肥料A,B每亩使用量x,z(单位:千克)之间对应数据如表所示.
x/千克 2 4 5 6 8
z/千克 3 7 4 5 6
y/百千克 3 4 4 4 5
  请从相关系数r(精确到0.01)的角度分析,y与x,y与z的关系(若|r|≥0.8,则线性相关程度很高).
参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),相关系数rxy=.
参考数据:≈2.24.
【方法总结】  利用相关系数r判断线性相关关系,需要应用公式计算出r的值,注意数据的处理和计算要准确.
  已知x,v与u的部分成对数据如下:
x 1 2 3 4 5
v 5 10 15 20 25
u 21 31 41 51 71
  通常用成对样本数据(vi,ui)的相关系数ruv来衡量u与v的线性相关性强弱,当<0.2时,认为u关于v的线性相关性较弱;当0.2≤≤0.8时,认为u关于v的线性相关性一般;当>0.8时,认为u关于v的线性相关性较强,判断x关于v,u关于v的线性相关程度.
参考公式:一组数据(v1,u1),(v2,u2),…,(vn,un)的相关系数ruv=.
参考数据:=250,=1480,≈6.1.
探究2 相关关系与向量夹角
问题1:向量夹角的大小可以用什么来进行刻画
问题2:用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式是什么关系
新知生成
1.两组成对数据表示的向量夹角的余弦值
若我们把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),为了两个向量表达的一致性,将向量的每个元素都减去均值,形成
a=(x1-,x2-,…,xn-),b=(y1-,y2-,…,yn-),
从而有cos==.
由上可知,用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的.
2.向量夹角与相关性的关系
当夹角属于0,时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低.
当夹角属于,π时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高.
当夹角为时,余弦值为0,这说明两组数据不相关.
新知运用
例2 下表为某省十二个地区某年1月气温与海拔及纬度的数据:
气温xi/℃ 6.9 17 16.9 11.3 14.2 12.3
海拔yi/m 3640 4420 4220 2840 3200 3140
纬度zi 32.2 33.8 35 36.3 37.1 38.4
气温xi/℃ 18.2 17.3 10.4 13.3 6.4 8.6
海拔yi/m 3360 4650 2680 3970 2080 2260
纬度zi 38.9 35.3 36.8 33.8 35.9 36.6
  (1)试分析1月气温与海拔,1月气温与纬度之间是否具有相关关系;
(2)用向量夹角分析气温与海拔之间、气温与纬度之间的相关关系.
【方法总结】  利用向量法判断两组成对数据的相关性,根据向量夹角的取值情况判断,要熟记向量夹角的取值与相关程度高低的关系,才能准确地判断.
经研究,每只潜叶蝇的平均产卵数y(单位:个)和夏季平均温度x(单位:℃)有关,现收集了某地区以往6年的数据,得到下面数据统计表格.
平均温度xi/℃ 21 23 25 27 29 31
产卵数yi/个 7 11 21 22 64 115
  用向量夹角来分析潜叶蝇的平均产卵数y与夏季平均温度x是否具有高度相关关系.
【随堂检测】
1.变量x与y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),其相关系数记为rxy.变量u与v相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),其相关系数记为ruv.试判断rxy,ruv与0三者之间的大小关系.
2.近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机抽取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据xi,yi,zi(i=1,2,3,4,5),数据如下表所示:
城市编号i 1 2 3 4 5
A指标xi 4 6 2 8 5
B指标yi 4 4 3 5 4
C指标zi 3 6 2 5 4
(1)分别求y与x之间的相关系数rxy及z与x之间的相关系数rxz,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数
rxy=,=2,=,=,(xi-)(yi-)=6,(xi-)(zi-)=12,≈1.41,≈0.95.
24.1 课时2 成对数据的统计相关性(二)
【学习目标】
1.会通过相关系数比较多组成对数据的相关性.(数学抽象)
2.了解样本相关系数与标准化数据向量夹角的余弦之间的关系.(逻辑推理、数据分析)
【自主预习】
1.在许多实际问题中,是否只有一个因素对变量的变化产生影响
【答案】 不是,在许多实际问题中,往往不止一个因素对变量的变化产生影响.
2.若我们把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),则这两个向量的紧密程度可以用什么度量
【答案】 可以用这两个向量的夹角大小来度量.
3.能否用向量夹角的大小来判断两组数据的相关程度呢
【答案】 能.
1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)
(1)回归分析中,若rxy=±1,则说明变量x,y之间具有完全的线性关系. (  )
(2)样本相关系数r的范围是r∈(-∞,+∞). (  )
(3)当两组成对数据对应的向量夹角为90°时,两组数据不相关. (  )
【答案】 (1)√ (2)× (3)√
2.某研究者搜集了某种花的一些数据(见下表),试分别判断花瓣长与花枝长之间、花瓣长与花萼长之间的相关关系(结果保留三位小数).
花瓣长x 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35
花枝长y 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13
花萼长z 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16
  【解析】 =xi≈40.444,=yi≈19.667,=zi≈16.167,
=(xi-)2≈33.691,=(yi-)2≈23.889,=(zi-)2≈10.250,sxy=(xi-)(yi-)≈27.093,sxz=(xi-)(zi-)≈14.815,
所以 rxy=≈≈≈0.955>0.8,
rxz=≈≈≈0.797>0.
上述结果表明花瓣长与花枝长之间正相关程度高,花瓣长与花萼长之间呈正相关关系.
【合作探究】
探究1 多组成对数据的相关性
新知生成
多组成对数据之间的相关性
一般情况下,我们可以考虑将其分成几个不同的两组数据分别进行相关性分析.
新知运用
例1 根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种肥料A,B每亩使用量x,z(单位:千克)之间对应数据如表所示.
x/千克 2 4 5 6 8
z/千克 3 7 4 5 6
y/百千克 3 4 4 4 5
  请从相关系数r(精确到0.01)的角度分析,y与x,y与z的关系(若|r|≥0.8,则线性相关程度很高).
参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),相关系数rxy=.
参考数据:≈2.24.
【解析】 由已知数据可得,
=xi=5,=zi=5,=yi=4,xiyi=106,=145,=82,=135,ziyi=103,
所以rxy==≈0.95>0.8,
rzy==≈0.67<0.8.
所以可以判断y与x的线性相关程度很高,y与z的线性相关程度较低.
【方法总结】  利用相关系数r判断线性相关关系,需要应用公式计算出r的值,注意数据的处理和计算要准确.
  已知x,v与u的部分成对数据如下:
x 1 2 3 4 5
v 5 10 15 20 25
u 21 31 41 51 71
  通常用成对样本数据(vi,ui)的相关系数ruv来衡量u与v的线性相关性强弱,当<0.2时,认为u关于v的线性相关性较弱;当0.2≤≤0.8时,认为u关于v的线性相关性一般;当>0.8时,认为u关于v的线性相关性较强,判断x关于v,u关于v的线性相关程度.
参考公式:一组数据(v1,u1),(v2,u2),…,(vn,un)的相关系数ruv=.
参考数据:=250,=1480,≈6.1.
【解析】 ∵==3,==15,==43,
xivi=1×5+2×10+3×15+4×20+5×25=275,
viui=5×21+10×31+15×41+20×51+25×71=3825,
∴rxv===1,
ruv=
=
==≈0.984>0.8,
故x关于v的线性相关性很强,u关于v的线性相关性较强.
探究2 相关关系与向量夹角
问题1:向量夹角的大小可以用什么来进行刻画
【答案】 向量夹角的大小可以用余弦来进行刻画.
问题2:用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式是什么关系
【答案】 两者本质上是一致的.
新知生成
1.两组成对数据表示的向量夹角的余弦值
若我们把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),为了两个向量表达的一致性,将向量的每个元素都减去均值,形成
a=(x1-,x2-,…,xn-),b=(y1-,y2-,…,yn-),
从而有cos==.
由上可知,用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的.
2.向量夹角与相关性的关系
当夹角属于0,时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低.
当夹角属于,π时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高.
当夹角为时,余弦值为0,这说明两组数据不相关.
新知运用
例2 下表为某省十二个地区某年1月气温与海拔及纬度的数据:
气温xi/℃ 6.9 17 16.9 11.3 14.2 12.3
海拔yi/m 3640 4420 4220 2840 3200 3140
纬度zi 32.2 33.8 35 36.3 37.1 38.4
气温xi/℃ 18.2 17.3 10.4 13.3 6.4 8.6
海拔yi/m 3360 4650 2680 3970 2080 2260
纬度zi 38.9 35.3 36.8 33.8 35.9 36.6
  (1)试分析1月气温与海拔,1月气温与纬度之间是否具有相关关系;
(2)用向量夹角分析气温与海拔之间、气温与纬度之间的相关关系.
【解析】 (1)依题意,=xi≈12.7333,=yi≈3371.6667,=zi≈35.8417,
将成对数据(x1,y1),(x2,y2),…,(x12,y12)以(,)为零点进行平移,得到平移后的成对数据(x1-,y1-),(x2-,y2-),…,(x12-,y12-),作出其散点图得气温与海拔的散点图,如图:
将成对数据(x1,z1),(x2,z2),…,(x12,z12)以(,)为零点进行平移,得到平移后的成对数据(x1-,z1-),(x2-,z2-),…,(x12-,z12-),作出其散点图得气温与纬度的散点图,如图:
观察散点图知,气温与海拔的散点图中的点大多数分布在第一、三象限,呈一定的正相关性,相关关系一般;气温与纬度的散点图在4个象限均有,并且很散,气温与纬度相关关系很弱.
(2)由(1)知,sx=≈3.9548,sy=≈797.4630,sz=≈1.8661, 
将xi-,yi-,zi-(i∈N*,i≤12)分别除以sx,sy,sz得标准化处理的数据对:
,,,,…,,,,,,,…,,,
把上述标准化处理后的成对数据分别记为(x'1,y'1),(x'2,y'2),…,(x'12,y'12),(x'1,z'1),(x'2,z'2),…,(x'12,z'12),
设标准化处理后的成对数据(x'1,y'1),(x'2,y'2),…,(x'12,y'12)的第一分量构成12维向量:x'=(x'1,x'2,…,x'12),第二分量构成12维向量:y'=(y'1,y'2,…,y'12),有x'·y'≈8.7372.
令向量x'与y'的夹角为θ1,于是得气温与海拔的相关系数r1=cos θ1=≈0.7281,
设标准化处理后的成对数据(x'1,z'1),(x'2,z'2),…,(x'12,z'12)的第一分量构成12维向量:x'=(x'1,x'2,…,x'12),第二分量构成12维向量:z'=(z'1,z'2,…,z'12),有x'·z'≈2.2294,
令向量x'与z'的夹角为θ2,于是得气温与纬度的相关系数r2=cos θ2=≈0.1858,
因此,气温与海拔呈正相关,相关关系一般;气温与纬度呈正相关,相关关系很弱.
【方法总结】  利用向量法判断两组成对数据的相关性,根据向量夹角的取值情况判断,要熟记向量夹角的取值与相关程度高低的关系,才能准确地判断.
经研究,每只潜叶蝇的平均产卵数y(单位:个)和夏季平均温度x(单位:℃)有关,现收集了某地区以往6年的数据,得到下面数据统计表格.
平均温度xi/℃ 21 23 25 27 29 31
产卵数yi/个 7 11 21 22 64 115
  用向量夹角来分析潜叶蝇的平均产卵数y与夏季平均温度x是否具有高度相关关系.
【解析】 =xi==26,=yi==40,
记a=(x1-,x2-,…,xn-),b=(y1-,y2-,…,yn-),
则可得a=(-5,-3,-1,1,3,5),b=(-33,-29,-19,-18,24,75),
于是有cos=
=
≈0.89.
由此可以看出,其余弦值接近1,也就是两向量的夹角接近0,这说明这两组数据正相关程度高.
【随堂检测】
1.变量x与y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),其相关系数记为rxy.变量u与v相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),其相关系数记为ruv.试判断rxy,ruv与0三者之间的大小关系.
【解析】 由数据(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可以看出来变量y随x的增大而增大,所以变量x与y之间是正相关,所以rxy>0.
由数据(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可以看出来变量v随u的增大而减小,所以变量u与v之间是负相关,所以ruv<0,
因此rxy>0>ruv.
2.近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机抽取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据xi,yi,zi(i=1,2,3,4,5),数据如下表所示:
城市编号i 1 2 3 4 5
A指标xi 4 6 2 8 5
B指标yi 4 4 3 5 4
C指标zi 3 6 2 5 4
(1)分别求y与x之间的相关系数rxy及z与x之间的相关系数rxz,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数
rxy=,=2,=,=,(xi-)(yi-)=6,(xi-)(zi-)=12,≈1.41,≈0.95.
【解析】 (1)由已知得==5,==4,==4,
所以rxy===≈0.95,
rxz===≈0.846,
所以y与x,z与x均呈正相关关系,又rxy>rxz,则y与x之间的相关性比z与x之间的相关性强.
(2)由(1)知,=5,=4,=4,
将题表中x,y,z的相关数据分别减去,,,
记a=(x1-,x2-,x3-,x4-,x5-),
b=(y1-,y2-,y3-,y4-,y5-),
c=(z1-,z2-,z3-,z4-,z5-),
则a=(-1,1,-3,3,0),b=(0,0,-1,1,0),c=(-1,2,-2,1,0),
于是cos ===≈0.95,cos =
==≈0.846,
所以y与x,z与x均呈正相关关系,又cos >cos ,则y与x之间的相关性比z与x之间的相关性强.
2

展开更多......

收起↑

资源列表