8.1.2 样本相关系数(练习,含解析)高中数学人教A版(2019)选择性必修 第三册

资源下载
  1. 二一教育资源

8.1.2 样本相关系数(练习,含解析)高中数学人教A版(2019)选择性必修 第三册

资源简介

8.1.2 样本相关系数
1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为(  )
A.-1 B.1
C.- D.
2.要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数r的大小,以下是四组数据的相关系数的值,则线性相关程度最强的是(  )
A.r1=-0.95 B.r2=-0.55
C.r3=0.45 D.r4=0.85
3.变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的样本相关系数,r2表示变量V与U之间的样本相关系数,则(  )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
4.若变量x,y的散点图如图所示,则x,y具有(  )
附:=5,=47.5,=120,=9 900,xiyi=1 080,若|r|>0.75,则线性相关程度很强.
A.很强的正相关关系 B.很强的负相关关系
C.很弱的正相关关系 D.很弱的负相关关系
5. 下列四组成对数据:①(-2,-3),(-1,-1),(0,1),(1,3),(2,5);②(0,0),(1,1),(2,4),(3,9),(4,16);③(-3,3),(-2,2),(-1,1),(0,0),(1,-1);④(-2,0),(-1,),(0,2),(1,),(2,0).其中样本相关系数最小的是(  )
附:样本相关系数r=.
A.① B.②
C.③ D.④
6.(多选)下面的散点图与样本相关系数r一定不符合的有(  )
      
A.      B.      C.      D.
7.(多选)在某地区随机抽取了8对母女的身高数据,如下表:
母亲的身高x/cm 154 157 158 159 160 161 162 163
女儿的身高y/cm 155 156 159 162 161 164 165 166
下列说法正确的是(  )
A.8个成对样本数据呈正相关
B.成对样本数据变量x和变量y的样本相关系数r约为0.963
C.将每个变量的观测数据减去均值,得到的成对样本数据(x1-,y1-),(x2-,y2-),…,(x8-,y8-)与原始成对样本数据相关性不相同
D.用样本相关系数r可以估计总体两个变量的相关系数
8.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第___象限.
9.如图是具有相关关系的两个变量的一组数据的散点图,若去掉一个点使得余下的5个点所对应的数据的样本相关系数最大,则应当去掉的点是____.
10.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值x、总胆固醇TC指标值y(单位:mmol/L)、空腹血糖CLU指标值z(单位:mmol/L)如下表所示.
编号 1 2 3 4 5 6 7 8
x 25 27 30 32 33 35 40 42
y 5.3 5.4 5.5 5.6 5.7 6.5 6.9 7.1
z 6.7 7.2 7.3 8.0 8.1 8.6 9.0 9.1
则变量y与x的样本相关系数是____,z与x的样本相关系数是____.
参考数据:=33,=6,=8,(xi-)2=244,(yi-)2≈3.6,(zi-)2=5.4,(xi-)(yi-)=28.3,(xi-)(zi-)=35.4,≈15.6,≈1.9,≈2.3.
11.根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间的对应数据的散点图如图所示.
依据数据的散点图可以看出,y与x具有线性相关关系,请计算样本相关系数r并加以说明.
附:≈0.95,若|r|>0.75,则线性相关程度很高.
r=.
12.(全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 根部横截面积xi/m2 材积量yi/m3
1 0.04 0.25
2 0.06 0.40
3 0.04 0.22
4 0.08 0.54
5 0.08 0.51
6 0.05 0.34
7 0.05 0.36
8 0.07 0.46
9 0.07 0.42
10 0.06 0.40
总和 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1) 估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2) 求该林区这种树木的根部横截面积与材积量的样本相关系数r(精确到0.01);
(3) 现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:r=,≈1.377.
13.为了监控某种医疗物资的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数 1 2 3 4
医疗物资尺寸/cm 9.95 10.12 9.96 9.96
抽取次数 5 6 7 8
医疗物资尺寸/cm 10.01 9.92 9.98 10.04
抽取次数 9 10 11 12
医疗物资尺寸/cm 10.26 9.91 10.13 10.02
抽取次数 13 14 15 16
医疗物资尺寸/cm 9.22 10.04 10.05 9.95
附:=xi=9.97,s==≈0.212,≈18.439,≈1 591.137,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个医疗物资的尺寸,i=1,2,3,…,16.
(1) 求(xi,i)(i=1,2,…,16)的样本相关系数r,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小.(若|r|<0.25,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小)
(2) 一天内抽检医疗物资中,如果出现了尺寸在(-3s,+3s)之外的医疗物资,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
8.1.2 样本相关系数
1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为( A )
A.-1 B.1
C.- D.
2.要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数r的大小,以下是四组数据的相关系数的值,则线性相关程度最强的是( A )
A.r1=-0.95 B.r2=-0.55
C.r3=0.45 D.r4=0.85
【解析】 当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.|r|≤1,且|r| 越接近于1,相关程度越大,|r|越接近于0,相关程度越小,故|r1|>|r4|>|r2|>|r3|,因此线性相关最强的是A.
3.变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的样本相关系数,r2表示变量V与U之间的样本相关系数,则( C )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
【解析】 对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.
4.若变量x,y的散点图如图所示,则x,y具有( A )
附:=5,=47.5,=120,=9 900,xiyi=1 080,若|r|>0.75,则线性相关程度很强.
A.很强的正相关关系 B.很强的负相关关系
C.很弱的正相关关系 D.很弱的负相关关系
【解析】 r==≈0.982 7,故x与y之间具有很强的正相关关系.
5. 下列四组成对数据:①(-2,-3),(-1,-1),(0,1),(1,3),(2,5);②(0,0),(1,1),(2,4),(3,9),(4,16);③(-3,3),(-2,2),(-1,1),(0,0),(1,-1);④(-2,0),(-1,),(0,2),(1,),(2,0).其中样本相关系数最小的是( C )
附:样本相关系数r=.
A.① B.②
C.③ D.④
【解析】 对于①,数据均在y=2x+1上,故样本相关系数为1;对于③,数据均在y=-x上,故样本相关系数为-1;对于②,可看出其数据为正相关,故样本相关系数大于0;对于④,显然所有数据无法落在某一个一次函数上,故-1<r<1,事实上,(xi-)(yi-)=xiyi-yi-xi+5=xiyi-5-5+5=xiyi-5,其中=0,xiyi=0,故(xi-)(yi-)=xiyi-5=0,故r=0.综上,样本相关系数最小的是③.
6.(多选)下面的散点图与样本相关系数r一定不符合的有( ACD )
      
A.      B.      C.      D.
【解析】 A中,由散点图可得,两相关变量呈负相关,故A错;B中,由散点图可得,两相关变量呈正相关,且相关系数可能是r=0.75;C中,若样本相关系数r=-1,则所有的点应该分布在一条直线上,散点图显然不符合,故C错;D中,若样本相关系数r=1,则所有的点应该分布在一条直线上,散点图显然不符合,故D错.
7.(多选)在某地区随机抽取了8对母女的身高数据,如下表:
母亲的身高x/cm 154 157 158 159 160 161 162 163
女儿的身高y/cm 155 156 159 162 161 164 165 166
下列说法正确的是( ABD )
A.8个成对样本数据呈正相关
B.成对样本数据变量x和变量y的样本相关系数r约为0.963
C.将每个变量的观测数据减去均值,得到的成对样本数据(x1-,y1-),(x2-,y2-),…,(x8-,y8-)与原始成对样本数据相关性不相同
D.用样本相关系数r可以估计总体两个变量的相关系数
【解析】 由成对样本数据可得,=(154+157+…+163)÷8=159.25,=(155+156+…+166)÷8=161,-8=59.5,-8=116,xiyi-8=80,则r==≈0.963,故B正确;由r≈0.963>0,则8个成对样本数据呈正相关关系,故A正确;对于C,平移后的成对样本数据所对应平面直角坐标系中的散点图,与原始的成对样本数据所对应的散点图形状完全一致,所以相关性完全相同,故C错误;根据统计学思想,D正确.
8.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第__二、四__象限.
9.如图是具有相关关系的两个变量的一组数据的散点图,若去掉一个点使得余下的5个点所对应的数据的样本相关系数最大,则应当去掉的点是__E__.
10.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值x、总胆固醇TC指标值y(单位:mmol/L)、空腹血糖CLU指标值z(单位:mmol/L)如下表所示.
编号 1 2 3 4 5 6 7 8
x 25 27 30 32 33 35 40 42
y 5.3 5.4 5.5 5.6 5.7 6.5 6.9 7.1
z 6.7 7.2 7.3 8.0 8.1 8.6 9.0 9.1
则变量y与x的样本相关系数是__0.95__,z与x的样本相关系数是__0.99__.
参考数据:=33,=6,=8,(xi-)2=244,(yi-)2≈3.6,(zi-)2=5.4,(xi-)(yi-)=28.3,(xi-)(zi-)=35.4,≈15.6,≈1.9,≈2.3.
11.根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间的对应数据的散点图如图所示.
依据数据的散点图可以看出,y与x具有线性相关关系,请计算样本相关系数r并加以说明.
附:≈0.95,若|r|>0.75,则线性相关程度很高.
r=.
【解答】 由题得==5,==4,所以(xi-)(yi-)=(-3)×(-1)+(-1)×0+0×0+1×0+3×1=6,==2, ==,故样本相关系数r===≈0.95.因为r>0.75,所以y与x的线性相关程度很高.
12.(全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 根部横截面积xi/m2 材积量yi/m3
1 0.04 0.25
2 0.06 0.40
3 0.04 0.22
4 0.08 0.54
5 0.08 0.51
6 0.05 0.34
7 0.05 0.36
8 0.07 0.46
9 0.07 0.42
10 0.06 0.40
总和 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1) 估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2) 求该林区这种树木的根部横截面积与材积量的样本相关系数r(精确到0.01);
(3) 现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:r=,≈1.377.
【解答】 (1) 样本中10棵这种树木的根部横截面积的平均值==0.06,材积量的平均值==0.39,据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.
(2) r===≈≈0.97,则r≈0.97.
(3) 设该林区这种树木的总材积量的估计值为Y m3,又已知树木的材积量与其根部横截面积近似成正比,可得=,解得Y=1 209 m3,则该林区这种树木的总材积量估计为1 209 m3.
13.为了监控某种医疗物资的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数 1 2 3 4
医疗物资尺寸/cm 9.95 10.12 9.96 9.96
抽取次数 5 6 7 8
医疗物资尺寸/cm 10.01 9.92 9.98 10.04
抽取次数 9 10 11 12
医疗物资尺寸/cm 10.26 9.91 10.13 10.02
抽取次数 13 14 15 16
医疗物资尺寸/cm 9.22 10.04 10.05 9.95
附:=xi=9.97,s==≈0.212,≈18.439,≈1 591.137,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个医疗物资的尺寸,i=1,2,3,…,16.
(1) 求(xi,i)(i=1,2,…,16)的样本相关系数r,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小.(若|r|<0.25,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小)
(2) 一天内抽检医疗物资中,如果出现了尺寸在(-3s,+3s)之外的医疗物资,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
【解答】 (1) 由样本数据得(xi,i)(i=1,2,3,…,16)的样本相关系数为r==≈-0.18,由于|r|<0.25,因此可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小.
(2) 由于=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.

展开更多......

收起↑

资源预览