7.2成对数据的线性相关性(习题)-2021-2022学年高二上学期数学北师大版(2019)选择性必修第一册(Word含答案解析)

资源下载
  1. 二一教育资源

7.2成对数据的线性相关性(习题)-2021-2022学年高二上学期数学北师大版(2019)选择性必修第一册(Word含答案解析)

资源简介

成对数据的线性相关性
1.下列数据x,y符合哪一种函数模型(  )
x 1 2 3 4 5 6 7 8 9 10
y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3
A.y=2+x B.y=2ex
C.y=2e) D.y=2+ln x
2.两个变量满足如下表关系.
X 5 10 15 20 25
Y 103 105 110 111 114
则两个变量线性相关程度(  )
A.较高  B.较低  C.不相关  D.不确定
3.对相关系数r,下列说法正确的是(  )
A.r越大,相关程度越大
B.r越小,相关程度越大
C.|r|越大,相关程度越小,|r|越小,相关程度越大
D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小
4.对变量X,Y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量U,V有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断(  )
①         ②
A.变量X与Y正相关,U与V正相关
B.变量X与Y正相关,U与V负相关
C.变量X与Y负相关,U与V正相关
D.变量X与Y负相关,U与V负相关
5.若回归直线方程中的回归系数b=0,则相关系数为(  )
A.r=1 B.r=-1
C.r=0 D.无法确定
二、填空题
6.某单位为了了解用电量Y(度)与气温X(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据得线性回归直线方程=x+中的=-2,预测当气温为-4 ℃时,用电量为________度.
7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:
=,=71,x=79,xiyi=1 481.
=≈-1.818 2,
=71-(-1.818 2)×≈77.36,
则销量每增加1 000箱,单位成本下降________元.
8.在研究教育与贫穷两个因素之间的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(X)和收入低于官方规定的贫困线的人数占本州人数的百分比(Y)的数据,建立的回归直线方程如下:Y=0.8X+4.6,斜率的估计值等于0.8,说明________;成年人受过9年或更少教育的百分比(X)和收入低于官方的贫困线的人数占本州人数的百分比(Y)之间的相关系数________(填“大于0”或“小于0”).
三、解答题
9.测得10对父子身高(单位:英寸)如下:
父亲 身高(X) 60 62 64 65 66 67 68 70 72 74
儿子 身高(Y) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70
(1)对变量Y与X进行相关性检验;
(2)如果Y与X之间具有相关关系,求回归直线方程;
(3)如果父亲身高为73英寸,试估计儿子的身高.
参考数据:=66.8,=67.01,x=44 794,y=4 494 1.93,2=4 462.24,2=4 490.34,xiyi=44 842.4,
10.下面的数据是年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平Y(满分100),以及每天花在看电视上的平均时间X(小时).
看电视的平均时间x 4.4 4.6 2.7 5.8 0.2 4.6
心脏功能水平y 52 53 69 57 89 65
(1)求心脏功能水平Y与每天花在看电视上的平均时间X之间的相关系数r;
(2)求心脏功能水平Y与每天花在看电视上的平均时间X的线性回归方程,并讨论方程是否有意义;(系数保留两位小数)
(3)估计平均每天看电视3小时的男子的心脏功能水平.
能力过关
11.两个变量Y与X的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是(  )
A.模型1的相关系数r为0.98
B.模型2的相关系数r为0.80
C.模型3的相关系数r为0.50
D.模型4的相关系数r为0.25
12.已知两个变量X和Y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量X的观测数据的平均数都为s,对变量Y的观测数据的平均数都是t,则下列说法正确的是(  )
A.l1与l2一定有公共点(s,t)
B.l1与l2相交,但交点一定不是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
13.(多选题)下列说法中正确的是(  )
A.线性相关系数r∈[-1,1]
B.在线性回归分析中,偏差越小,线性相关系数的绝对值越大
C.相关系数r越小,说明变量之间的线性相关程度越小
D.在散点图中,若n个点在一条直线上,|r|=1
14.(一题两空)某市居民2015~2019年家庭年平均收入X(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份 2015 2016 2017 2018 2019
收入X 11.5 12.1 13 13.3 15
支出Y 6.8 8.8 9.8 10 12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________相关关系(填“正”或“负”).
15.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=12,yi=14,x=23,则实数b的值为________.
1.下列数据x,y符合哪一种函数模型(  )
x 1 2 3 4 5 6 7 8 9 10
y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3
A.y=2+x B.y=2ex
C.y=2e) D.y=2+ln x
D [分别将x的值代入解析式判断知满足y=2+ln x.]
2.两个变量满足如下表关系.
X 5 10 15 20 25
Y 103 105 110 111 114
则两个变量线性相关程度(  )
A.较高  B.较低  C.不相关  D.不确定
A [xi=75,yi=543,x=1 375,xiyi=8 285,y=59 051,=15,=108.6.
r=
=≈0.982 6.
故两个变量间的线性相关程度较高.]
3.对相关系数r,下列说法正确的是(  )
A.r越大,相关程度越大
B.r越小,相关程度越大
C.|r|越大,相关程度越小,|r|越小,相关程度越大
D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小
D [|r|越接近于1,偏差越小,相关程度越大,|r|越接近于0,偏差越大,相关程度越小,故选D.]
4.对变量X,Y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量U,V有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断(  )
①         ②
A.变量X与Y正相关,U与V正相关
B.变量X与Y正相关,U与V负相关
C.变量X与Y负相关,U与V正相关
D.变量X与Y负相关,U与V负相关
C [由题图①可知,各点整体呈递减趋势,X与Y负相关,由题图②可知,各点整体呈递增趋势,U与V正相关.]
5.若回归直线方程中的回归系数b=0,则相关系数为(  )
A.r=1 B.r=-1
C.r=0 D.无法确定
C [当b=0时,有 (xi-)(yi-)=0,故相关关系r=0.]
二、填空题
6.某单位为了了解用电量Y(度)与气温X(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据得线性回归直线方程=x+中的=-2,预测当气温为-4 ℃时,用电量为________度.
68 [回归直线方程过点(,),根据题意得==10,==40,将(10,40)代入=-2x+,解得=60,则=-2x+60,当x=-4时,=(-2)×(-4)+60=68,即当气温为-4 ℃时,用电量约为68度.]
7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:
=,=71,x=79,xiyi=1 481.
=≈-1.818 2,
=71-(-1.818 2)×≈77.36,
则销量每增加1 000箱,单位成本下降________元.
1.818 2 [由已知可得,=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.]
8.在研究教育与贫穷两个因素之间的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(X)和收入低于官方规定的贫困线的人数占本州人数的百分比(Y)的数据,建立的回归直线方程如下:Y=0.8X+4.6,斜率的估计值等于0.8,说明________;成年人受过9年或更少教育的百分比(X)和收入低于官方的贫困线的人数占本州人数的百分比(Y)之间的相关系数________(填“大于0”或“小于0”).
[答案] 一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右 大于0
三、解答题
9.测得10对父子身高(单位:英寸)如下:
父亲 身高(X) 60 62 64 65 66 67 68 70 72 74
儿子 身高(Y) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70
(1)对变量Y与X进行相关性检验;
(2)如果Y与X之间具有相关关系,求回归直线方程;
(3)如果父亲身高为73英寸,试估计儿子的身高.
参考数据:=66.8,=67.01,x=44 794,y=4 494 1.93,2=4 462.24,2=4 490.34,xiyi=44 842.4,
[解]  (1)r=≈0.980 4,
因为r≈0.980 4非常接近于1,所以Y与X之间具有较强的线性相关关系.
(2)设回归直线方程为Y=bX+a,=≈0.464 6,=-≈35.97,
所以回归直线方程为Y=0.464 6X+35.97.
(3)x=73时,y=69.9,所以父亲身高为73英寸时,儿子的身高约为69.9英寸.
10.下面的数据是年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平Y(满分100),以及每天花在看电视上的平均时间X(小时).
看电视的平均时间x 4.4 4.6 2.7 5.8 0.2 4.6
心脏功能水平y 52 53 69 57 89 65
(1)求心脏功能水平Y与每天花在看电视上的平均时间X之间的相关系数r;
(2)求心脏功能水平Y与每天花在看电视上的平均时间X的线性回归方程,并讨论方程是否有意义;(系数保留两位小数)
(3)估计平均每天看电视3小时的男子的心脏功能水平.
[解] n=6,=(4.4+4.6+2.7+5.8+0.2+4.6)≈3.716,=(52+53+69+57+89+65)≈64.166 7,
x-62=(4.42+4.62+2.72+5.82+0.22+4.62)-6×3.7162≈19.798 0,
y-62=(522+532+692+572+892+652)-6×64.166 72≈964.833 3,
xiyi-6=(4.4×52+4.6×53+…+4.6×65)-6×3.716×64.166 7≈-124.360 7.
(1)心脏功能水平Y与每天花在看电视上的平均时间X之间的相关系数:
r=≈-0.899 8.
(2)=≈-6.28,=-=87.50,心脏功能水平Y与每天花在看电视上的平均时间x的线性回归方程为Y=-6.28X+87.50.
因为|r|=0.898,所以有相当大的把握认为Y与X之间有线性关系,这个方程是有意义的.
(3)将x=3代入线性回归方程,可得y=68.66,即平均每天看电视3小时,心脏功能水平约为68.66.
能力过关
11.两个变量Y与X的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是(  )
A.模型1的相关系数r为0.98
B.模型2的相关系数r为0.80
C.模型3的相关系数r为0.50
D.模型4的相关系数r为0.25
A [在两个变量Y与X的回归模型中,它们的相关系数|r|越近于1,模拟效果越好,在四个选项中A的相关系数最接近1,所以拟合效果最好的是模型1.]
12.已知两个变量X和Y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量X的观测数据的平均数都为s,对变量Y的观测数据的平均数都是t,则下列说法正确的是(  )
A.l1与l2一定有公共点(s,t)
B.l1与l2相交,但交点一定不是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
A [由于回归直线Y=bX+a恒过(,)点,又两人对变量X的观测数据的平均值为s,对变量Y的观测数据的平均值为t,所以l1和l2恒过点(s,t).]
13.(多选题)下列说法中正确的是(  )
A.线性相关系数r∈[-1,1]
B.在线性回归分析中,偏差越小,线性相关系数的绝对值越大
C.相关系数r越小,说明变量之间的线性相关程度越小
D.在散点图中,若n个点在一条直线上,|r|=1
ABD [由线性相关系数的定义知,只有C不正确.]
14.(一题两空)某市居民2015~2019年家庭年平均收入X(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份 2015 2016 2017 2018 2019
收入X 11.5 12.1 13 13.3 15
支出Y 6.8 8.8 9.8 10 12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________相关关系(填“正”或“负”).
13 正 [中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.]
15.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=12,yi=14,x=23,则实数b的值为________.
 [令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时==,==,代入y=bt-,得=b×-,解得b=.]

展开更多......

收起↑

资源预览