2025-2026学年人教A版数学选择性必修第三册 第八章 成对数据的统计分析 单元测试(含答案)

资源下载
  1. 二一教育资源

2025-2026学年人教A版数学选择性必修第三册 第八章 成对数据的统计分析 单元测试(含答案)

资源简介

第八章 成对数据的统计分析
(范围:第八章 时间:120分钟 分值:150分)
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的选项中,只有一项符合题目要求.
1.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法不正确的是(  )
A.用决定系数R2来刻画拟合效果,R2的值越小,说明模型的拟合效果越好
B.由样本数据得到的经验回归直线=x+必过样本点的中心(,)
C.残差平方和越小的模型,拟合的效果越好
D.若变量y和x之间的样本相关系数r=-0.936 2,则变量y与x之间具有较强的线性相关关系
2.已知呈现线性相关关系的变量x,y之间的一组数据如下表所示,则y关于x的经验回归直线一定过点(  )
x 0.1 0.2 0.3 0.5
y 2.11 2.85 4.08 10.15
A.(0.1,2.11) B.(0.2,2.85)
C.(0.3,4.08) D.(0.275,4.797 5)
3.小明利用课余时间参与科学探究活动——观察蒜苗的生长,下表记录了大蒜发芽后第4天至第8天的蒜苗高度.若用最小二乘法求得蒜苗高度y(单位:cm)关于时间x(单位:天)的经验回归方程为=x-4.4,小明根据经验回归方程预测,从第n天开始蒜苗高度大于20 cm,则n的值为(  )
时间x/天 4 5 6 7 8
蒜苗高度y/cm 1 2.4 4.6 5.6 6.4
A.15 B.16
C.17 D.18
4.若y关于x经验回归方程为=2-3.5x,则变量x增加1个单位,变量y平均(  )
A.减少3.5个单位 B.增加2个单位
C.增加3.5个单位 D.减少2个单位
5.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 1 2 3 4
用水量y 4.5 4 3 2.5
已知用水量y与月份x之间有较强的线性相关关系,其经验回归方程是=-0.7x+,则等于(  )
A.10.5 B.5.15
C.5.2 D.5.25
6.针对中学生追星问题,某校团委对“中学生性别和中学生追星是否有关”做了一次调查,调查样本中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的.若依据小概率值α=0.05的独立性检验,可以认为中学生性别和中学生追星有关,则调查样本中男生至少有(  )
附:χ2=.
A.12人 B.11人
C.10人 D.18人
7.某种微生物的繁殖速度y与生长环境中的营养物质浓度x相关,在一定条件下可用模型y=2lg x进行拟合.在这个条件下,要使y增加2个单位,则应该(  )
A.使x增加1个单位
B.使x增加2个单位
C.使x增加到原来的2倍
D.使x增加到原来的10倍
8.关于变量x,y,下列说法正确的有(  )
①若样本相关系数r>0,则x增大时,y也相应增大;
②若样本相关系数r<0,则x增大时,y也相应增大;
③若样本相关系数r=1或-1,则x与y的关系完全对应(函数关系),散点图中的各点均在一条直线上.
A.①② B.②③
C.①③ D.①②③
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.已知在最小二乘法原理下,求得y关于x的经验回归方程为=-0.7x+10.3,且变量x,y之间的相关数据如表所示,则下列说法错误的是(  )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈正相关关系
B.可以预测,当x=20时,=3.7
C.m=4.7
D.经验回归直线=-0.7x+10.3必过点(9,4)
10.下图是某小区2023年8月至2024年8月间,当月在售二手房均价(单位:万元/m2)的散点图.(图中月份代码1~13分别对应2023年8月~2024年8月)
根据散点图选择y=a+b和y=c+dln x两个模型进行拟合,经过数据处理得到的两个经验回归方程分别为=0.936 9+0.028 5和=0.955 4+0.030 6ln x,并得到统计量R2的值:
经验回归方程 =0.936 9+0.028 5 =0.955 4+0.030 6ln x
R2 0.923 0.973
则下列说法正确的是(  )
A.当月在售二手房均价y与月份代码x呈负相关关系
B.由=0.936 9+0.028 5预测2027年8月在售二手房均价约为1.136 4万元/m2
C.曲线=0.936 9+0.028 5与=0.955 4+0.030 6ln x都经过点(,)
D.模型=0.955 4+0.030 6ln x的拟合效果比模型=0.936 9+0.028 5的拟合效果好
11.某市通过随机询问100名居民能否做到“光盘”行动,得到如下的2×2列联表,并进行独立性检验,则(  )
单位:名
性别 光盘 合计
不能做到 能做到
男 45 b 55
女 c 15
合计 100
A.c=30
B.零假设为H0:能否做到“光盘”行动与性别有关
C.χ2>3.841
D.依据小概率值α=0.1的独立性检验,可以认为该市居民能否做到“光盘”行动与性别有关
三、填空题:本题共3小题,每小题5分,共15分.
12.对于经验回归方程=x+,当x=3时,对应的y的估计值是17,当x=8时,对应的y的估计值是22,那么,该经验回归方程为____________;根据经验回归方程,当x=________时,y的估计值是38.
13.某旅行社为调查市民对人文景观的态度(喜欢或不喜欢)是否与年龄有关,随机调查了55名市民,所得数据如下表所示.
单位:名
年龄 态度 合计
喜欢 不喜欢
大于40岁 20 5 25
20岁至40岁 10 20 30
合计 30 25 55
根据小概率值α=0.005的独立性检验,________推断出市民对人文景观的态度与年龄有关.(填“能”或“不能”)
14.对于数据组(xi,yi)(i=1,2,…,n),如果由经验回归方程得到的对应自变量xi的估计值是i,那么将yi-i称为对应点(xi,yi)的残差.某商场为了给一种新商品进行合理定价,将该商品按事先拟定的价格进行试销,得到如下所示数据.
单价x/元 8.2 8.4 8.6 8.8
销量y/件 84 83 78 m
根据表中的数据,得到销量y(单位:件)与单价x(单位:元)之间的经验回归方程为=-20x+,据计算,样本点(8.4,83)处的残差为1,则m=__________.
四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(13分)偏差是指个别测定值与测定的平均值之差.在成绩统计中,我们把某个同学的某科考试成绩与该科平均分的差叫某科偏差(实际成绩-平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下表所示.
学生序号 1 2 3 4 5 6 7 8
数学偏差x 20 15 13 3 2 -5 -10 -18
物理偏差y 6.5 3.5 3.5 1.5 0.5 -0.5 -2.5 -3.5
(1)若x与y之间具有线性相关关系,求y关于x的经验回归方程;
(2)若该次考试数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.
附:iyi=324,=1 256,
经验回归方程=x+中,=,=-.
16.(15分)长跑对于培养人们克服困难、磨炼刻苦耐劳的顽强意志具有良好的作用,特别是对那些冬季怕冷、爱睡懒觉、不愿锻炼的人起到积极的促进作用.某校开展冬季长跑活动,为了解学生对冬季长跑活动是否感兴趣与性别是否有关,某调查小组随机抽取该校100名学生进行问卷调查,根据所得数据制成如下2×2列联表:
单位:人
性别 冬季长跑活动 合计
感兴趣 不感兴趣
男 8
女 32
合计 80 100
(1)完成上面的2×2列联表,依据小概率值α=0.1的独立性检验,能否认为学生对冬季长跑活动是否感兴趣与性别有关联?
(2)若不感兴趣的男生中恰有3名高三学生,现从不感兴趣的男生中随机选出3名学生进行二次调查,记选出的学生中高三学生的人数为X,求X的分布列与数学期望.
附:χ2=,其中n=a+b+c+d.
17.(15分)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
单位:件
车间 品级 合计
优级品 合格品 不合格品
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
填写如下列联表:
单位:件
车间 品级
优级品 非优级品
甲车间
乙车间
依据小概率值α=0.05的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.01的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5,设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,那么认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
附:χ2=.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
18.(17分)某田径协会组织开展竞走的步长和步频之间的关系的课题研究,得到相应的试验数据:
步频x/s 0.28 0.29 0.30 0.31 0.32
步长y/cm 90 95 99 103 117
(1)根据表中数据,得到步频和步长近似为线性相关关系,求出y关于x的经验回归方程,并利用经验回归方程预测,当步长为80 cm时,步频约是多少?
(2)记i=yi-i=yi-xi-,其中yi为观测值,i为预测值,i为对应(xi,yi)的残差,求(1)中步长的残差的和,并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立,请证明;若不成立,请说明理由.
参考数据:=0.451,iyi=151.82.
参考公式:=,=-.
19.(17分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄分为“25周岁以上(含25周岁)”和“25周岁以下”两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2名,求至少抽到1名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件列出2×2列联表,并依据小概率值α=0.1的独立性检验,分析“生产能手与工人所在的年龄组”是否有关.
第八章 成对数据的统计分析
(范围:第八章 时间:120分钟 分值:150分)
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的选项中,只有一项符合题目要求.
1.A 解析:对于A,用决定系数R2来刻画拟合效果,R2的值越接近1,说明模型的拟合效果越好,错误.对于B,由样本数据得到的经验回归直线=x+必过样本点的中心(,),正确.对于C,残差平方和越小的模型,拟合效果越好,正确.对于D,越接近1,变量y与x之间的线性相关程度越强,正确.故选A.
2.D 解析:经验回归直线一定过点(,),通过题表中的数据计算得=0.275,=4.797 5,易知选D.
3.D 解析:由题表中数据得=6,=4,代入方程=-4.4,解得=1.4,
则经验回归方程为=1.4x-4.4.
令1.4x-4.4>20,解得x>17.4.因为x∈N*,所以x≥18.
故选D.
4.A 解析:由经验回归方程可知=-3.5,则变量x增加1个单位,变量y平均减少3.5个单位.
5.D 解析:因为==2.5,==3.5,所以3.5=-0.7×2.5+,解得=5.25.
6.A 解析:设男生人数为x,依题意可得如下2×2列联表:
单位:人
性别 追星 合计
是 否
男 x

合计 x
若依据小概率值α=0.05的独立性检验,可以认为中学生性别和中学生追星有关,则χ2≥3.841.由χ2==x≥3.841及,为整数,可知x最小可取12,所以男生至少有12人.故选A.
7.D 解析:设y的增加量为Δy=y1-y2,x的增加量为Δx=x1-x2,
故可得Δy=2lg x1-2lg x2=2lg=2,解得=10.
故要使得y增加2个单位,x应增加到原来的10倍.故选D.
8.C 解析:若r>0,则两个变量正相关,x增大时,y也相应增大,故①正确.若r<0,则两个变量负相关,x增大时,y相应减小,故②错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.ABC 解析:对于A,由x与y的经验回归方程,可知=-0.7<0,
所以变量x,y之间呈负相关关系,故A错误;
对于B,当x=20时,=-0.7×20+10.3=-3.7,故B错误;
对于C,由题表中数据可知=9,==,由点(,)必在经验回归直线上,得=-0.7×9+10.3,解得m=5,故C错误;
对于D,因为m=5,所以==4,所以经验回归直线必过点(9,4),故D正确.故选ABC.
10.BD 解析:对于A,由题图可知散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相关关系,故A不正确;对于B,令x=49,得=0.936 9+0.028 5×=1.136 4,所以可以预测2027年8月在售二手房均价约为1.136 4万元/m2,故B正确;对于C,非线性回归曲线不一定经过点(,),故C错误;对于D,R2越大,模型拟合效果越好,0.923<0.973,故D正确.
11.AD 解析:由题可得a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.
零假设为H0:能否做到“光盘”行动与性别无关.
计算可得χ2=≈3.030.
因为x0.1=2.706<3.030,
所以依据小概率α=0.1的独立性检验,可以认为该市居民能否做到“光盘”行动与性别有关,此推断犯错误的概率不大于0.1.
三、填空题:本题共3小题,每小题5分,共15分.
12. =x+14 24 解析:把(3,17),(8,22)代入经验回归方程得解得
所以经验回归方程为=x+14.
令x+14=38,得x=24.
13. 能 解析:零假设为H0:市民对人文景观的态度与年龄无关.由题表中数据计算可得χ2=≈11.978>7.879=x0.005,根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为市民对人文景观的态度有关,此推断犯错误的概率不大于0.005.
14. 75 解析:根据样本点(8.4,83)处的残差为1,得83-(-20×8.4+)=1,得=250,
所以=-20x+250.
==8.5,==,由=-20+250,得m=75.
四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤.
15.
解:(1)由题意可得,
=×[20+15+13+3+2+(-5)+(-10)+(-18)]=,
=×[6.5+3.5+3.5+1.5+0.5+(-0.5)+(-2.5)+(-3.5)]=,
===,
所以=- =-×=.
故经验回归方程为=x+.
(2)由题意,设该同学的物理成绩为ω,则物理偏差为ω-91.5.
而数学偏差为128-120=8,所以ω-91.5=×8+,解得ω=94.
所以,可以预测这位同学的物理成绩为94分.
16.
解:(1)根据已知数据可补全2×2列联表如下:
单位:人
性别 冬季长跑活动 合计
感兴趣 不感兴趣
男 48 8 56
女 32 12 44
合计 80 20 100
零假设为H0:学生对冬季长跑活动是否感兴趣与性别无关.
由表中数据计算得χ2=≈2.597<2.706=x0.1,
所以依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,即可以认为学生对“冬季长跑活动”是否感兴趣与性别无关.
(2)由题知X的所有可能取值为0,1,2,3,
因为P(X=0)===,P(X=1)===,P(X=2)==,P(X=3)==,所以X的分布列为
X 0 1 2 3
P
E(X)=0×+1×+2×+3×=.
17.解:(1)根据题意可得2×2列联表:
单位:件
车间 品级
优级品 非优级品
甲车间 26 24
乙车间 70 30
零假设为H0:甲、乙两车间产品的优级品率无差异.
可得χ2==4.687 5.
因为x0.05=3.841<4.687 5<6.635=x0.01,
所以依据小概率值α=0.05的独立性检验,推断H0不成立,即可以认为甲、乙两车间产品的优级品率存在差异,此推断犯错误的概率不超过0.05.依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为甲、乙两车间产品的优级品率无差异.
(2)由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为=0.64,
用频率估计概率可得=0.64.
又因为升级改造前该工厂产品的优级品率p=0.5,
则p+1.65=0.5+1.65×≈0.5+1.65×≈0.567,
可知>p+1.65,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
18.
解:(1)=i=0.3,=i=100.8,
==620,=100.8-620×0.3=-85.2,
所以经验回归方程为=620x-85.2.
将y=80代入得80=620x-85.2,解得x≈0.27,所以当步长为80 cm时,步频约是0.27 s.
(2)由(1)可知1=620×0.28-85.2=88.4,1=90-88.4=1.6;
2=620×0.29-85.2=94.6,2=95-94.6=0.4;
3=620×0.30-85.2=100.8,3=99-100.8=-1.8;
4=620×0.31-85.2=107,4=103-107=-4;
5=620×0.32-85.2=113.2,5=117-113.2=3.8,
所以i=1.6+0.4-1.8-4+3.8=0,即步长残差和为0.
对任意具有线性相关关系的两个变量都成立,证明如下:
i=(yi-i)=(yi-xi-)=i-i-n=n-n-n(-)=0.
19.
解:(1)由已知得,样本中有“25周岁以上(含25周岁)”组工人60名,“25周岁以下”组工人40名,
所以样本中日平均生产件数不足60件的工人中,
“25周岁以上(含25周岁)”组工人有60×0.05=3名,
记为A1,A2,A3;
“25周岁以下”组工人有40×0.05=2名,
记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种:
(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
故所求的概率p=.
(2)由题图可知,在抽取的100名工人中,
“25周岁以上(含25周岁)”组中的生产能手有60×(0.2+0.05)=15名,
“25周岁以下”组中的生产能手有40×(0.325+0.05)=15名.
据此可得2×2列联表如下:
单位:名
年龄组 生产能手情况 合计
生产能手 非生产能手
25周岁以上(含25周岁)组 15 45 60
25周岁以下组 15 25 40
合计 30 70 100
零假设为H0:生产能手与工人所在的年龄组无关.
由表中数据得χ2==≈1.79<2.706=x0.1.
依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即生产能手与工人所在的年龄组无关.
1/19

展开更多......

收起↑

资源预览