2025-2026学年人教A版数学选择性必修三 第8章 成对数据的统计分析 单元达标测试(含答案)

资源下载
  1. 二一教育资源

2025-2026学年人教A版数学选择性必修三 第8章 成对数据的统计分析 单元达标测试(含答案)

资源简介

第8章 成对数据的统计分析
(时间:120分钟 满分:150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.下列语句表示的事件中的因素不具有相关关系的是(  )
A.瑞雪兆丰年
B.名师出高徒
C.吸烟有害健康
D.喜鹊叫喜,乌鸦叫丧
2.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(  )
A.r2C.r43.某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x(单位:元)和销售量y(单位:件)之间的一组数据如表所示:
价格x 9 9.5 10 10.5 11
销售量y 11 10 8 6 5
按公式计算,y与x的经验回归方程是=-3.2x+,样本相关系数|r|=0.986,则下列说法错误的是(  )
A.变量x,y负相关且相关性较强
B.=40
C.当x=8.5时,=12.8
D.相应于点(10.5,6)的残差为0.4
4.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查,y与x具有线性相关关系,其经验回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(  )
A.83% B.72%
C.67% D.66%
5.在一项调查中有两个变量x(单位:千元)和y(单位:t),由这两个变量近8年来的取值数据得到的散点图如图所示,那么适宜作为y关于x的经验回归方程类型的是(  )
A.y=a+bx B.y=c+d(x>0)
C.y=m+nx2 D.y=p+qex(q>0)
6.甲、乙两个平行班(甲班A老师教,乙班B老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表如下表所示.
单位:人
班级 是否及格 合计
不及格 及格
甲班(A教) 4 36 40
乙班(B教) 16 24 40
合计 20 60 80
有充分证据推断不及格人数与不同老师执教有关,且此推断犯错误的概率不超过(  )
A.0.005 B.0.001
C.0.002 5 D.无充分依据
7.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=0.85x-85.71,则下列结论错误的是(  )
A.y与x具有正的线性相关关系
B.若该大学某女生身高为160 cm,则其体重可能为50.29 kg
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
8.随机调查了相同数量的男生、女生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且根据小概率值α=0.01的χ2独立性检验,推断喜欢网络课程与性别有关,但根据小概率值α=0.001的χ2独立性检验推断喜欢网络课程与性别无关,则被调查的男生、女生总数量可能为(  )
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.100 B.200 C.300 D.400
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法正确的是(  )
A.由样本数据得到的经验回归直线x+必过样本点的中心()
B.残差平方和越小的模型,拟合的效果越好
C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若变量y和x之间的样本相关系数为r=-0.936 2,则变量y和x之间的线性相关程度很弱
10.有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则(  )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
11.晚上睡眠充足是提高学习效率的必要条件.某高中高二的学生分为寄宿生和走读生两类,其中寄宿生晚上9:50必须休息,睡眠能得到充分的保证;走读生晚上大多10:30休息,甚至更晚.为了解这两类学生的学习效率情况,该校有关部门分别对这两类学生学习总成绩的前50名进行问卷调查,得到的统计数据如表所示,则(  )
学习效率 寄宿生 走读生
学习效率高 30 10
学习效率低 20 40
附:χ2=.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
A.走读生前50名学生中有40%的学生学习效率高
B.寄宿生前50名学生中有60%的学生学习效率高
C.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错误的概率超过0.05
D.根据小概率值α=0.001的独立性检验推断“学生学习效率高低与晚上睡眠是否充足有关”
三、填空题:本题共3小题,每小题5分,共15分.请把正确答案填在题中的横线上.
12.A种棉花以绒长、品质好、产量高著称于世.已知某地区所产A种棉花的产量y(单位:万吨)与光照时长x(单位:小时)之间的关系如表.若根据表中的数据用最小二乘法求得y关于x的经验回归方程为=6x+6,则下列说法中正确的有     .(填序号)
光照时长x/小时 1 2 3 4 5
产量y/万吨 12 19 m 31 36
①该经验回归直线过点(3,24);②A种棉花的产量与光照时长成正相关;③m的值是22;④当光照时长为11小时时,A种棉花的产量一定为72万吨.
13.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产成本,某白酒酿造企业市场部对该企业9月份的产品销量x(单位:千箱)与单位成本y(单位:元)的资料进行经验回归分析,结果如下:=71,=79,xiyi=1 481,≈-1.818 2,=71-(-1.818 2)×≈77.36,则销售量每增加1千箱,单位成本下降     元.
14.对具有线性相关关系的变量x,y,测得一组数据如表:
x 2 4 5 6 8
y 20 40 60 70 80
根据上表,利用最小二乘法得它们的经验回归方程为=10.5x+,据此模型预测,当x=10时,y的估计值是     .
四、解答题:本题共5小题,共77分.解答应写出必要的文字说明、证明过程或演算步骤.
15.(13分)甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:
零件尺寸x 1.01 1.02 1.03 1.04 1.05
零件 个数y 甲 3 7 8 9 3
乙 7 4 4 4 a
由表中数据得y关于x的经验回归方程为=-91+100x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01(cm).
完成下面列联表,根据小概率值α=0.01的独立性检验,能否推断出加工零件的质量与甲、乙两机床有关
单位:个
机床 零件是不是合格 合计
合格 不合格


合计
16.(15分)某商场新进了一种新款T恤衫,在五天内这种T恤衫的销售情况如表:
第x天 1 2 3 4 5
销售量y/件 17 38 59 80 106
(1)求y关于x的经验回归方程x+;
(2)若每件T恤衫利润为20元,试根据(1)求出的经验回归方程,预测该商场第8天能获利多少元
参考数据:xiyi=17×1+38×2+59×3+80×4+106×5=1 120.
参考公式:经验回归方程是x+,其中
17.(15分)足不出户,手机下单,送菜到家,轻松逛起手机“菜市场”,拎起手机“菜篮子”,省心又省力.某手机App(应用程序)公司为了解居民使用这款App的人数及满意度,对一大型小区居民开展5个月的调查活动,统计了使用这款App不满意的人数如下表所示:
月份 1 2 3 4 5
不满意的人数 120 105 100 95 80
(1)请利用所给数据求不满意的人数y与月份x之间的经验回归方程x+,并预测该小区10月份对这款App不满意的人数;
(2)工作人员发现使用这款App居民的年龄X近似服从正态分布N(35,42),求P(27≤X≤47)的值;
(3)工作人员从这5个月内的调查表中随机抽查100人,调查是否使用这款App与性别的关系,得到下表:
单位:人
性别 是否使用App 合计
使用App 不使用App
女性 48 12 60
男性 22 18 40
合计 70 30 100
依据小概率值α=0.01的χ2独立性检验判断使用这款App是否与性别有关.
参考公式:.
附:随机变量:X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
χ2=(其中n=a+b+c+d).
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
18.(17分)某省高考政策修改为取消文理科,实行“3+3”,成绩由语文、数学、外语统一高考成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在[15,45)称为中青年,年龄在[45,75)称为中老年),并把调查结果制成下表:
年龄/岁 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75)
频数 5 15 10 10 5 5
了解 4 12 6 5 2 1
(1)分别估计中青年和中老年对新高考了解的概率;
(2)请根据上表完成下面2×2列联表,根据小概率值α=0.05的χ2的独立性检验,分析对新高考的了解与年龄(中青年、中老年)是否有关;
单位:人
年龄 是否了解新高考 合计
了解新高考 不了解新高考
中青年
中老年
合计
附:χ2=,n=a+b+c+d.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
(3)若从年龄在区间[55,65)内的被调查者中随机选取3人进行调查,记选中的3人中了解新高考的人数为X,求X的分布列以及E(X).
19.(17分)甲、乙两名同学在对具有相关关系的两个变量进行回归分析时,得到如下数据.
x 4 6 8 10 12
y 4 12 24 50 72
甲发现表中散点集中在曲线y=c1x2+c2x附近(其中c1,c2是参数,且c1>0).他先设y'=,将表中数据进行转换,得到新的成对数据(xi,y'i)(i=1,2,3,4,5),再用一元线性回归模型y'=x+拟合;乙根据数据得到经验回归方程为y=8.7x-37.2.
(1)列出新的数据表(xi,y'i)(i=1,2,3,4,5),并求y'=x+;
(2)在统计学中,我们通常计算不同回归模型的残差平方和(残差平方和用v2表示)来判断拟合效果,v2越小,拟合效果越好.乙同学计算出其模型的残差平方和为143.6,请你计算甲同学模型y=c1x2+c2x的残差平方和,并比较拟合效果.
(参考公式:,v2=(yi-)2)
第8章 成对数据的统计分析
(时间:120分钟 满分:150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1. D
解析:“喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系,故选D.
2. A
解析:比较相关程度与正负相关,相关系数r的范围是[-1,1],当r<0时,数据为负相关,当r>0时,数据为正相关,|r|越大,相关性越强,由图中点的紧密程度和增减性可知r23. D
解析:对于A,由题表可知,y随x的增大而变小,且样本相关系数|r|=0.986,与1较接近,
故变量x,y负相关且相关性较强,故A正确.
对于B,×(9+9.5+10+10.5+11)=10,
×(11+10+8+6+5)=8,
∵y与x的经验回归方程=-3.2x+,恒过定点(10,8),
∴8=-3.2×10+,解得=40,故B正确.
对于C,当x=8.5时,=-3.2×8.5+40=12.8,故C正确.
对于D,相应于点(10.5,6)的残差=6-(-3.2×10.5+40)=-0.4,故D错误.
故选D.
4. A
解析:将y=7.675代入经验回归方程,可计算得x≈9.26,7.675÷9.26≈0.83,
即该城市人均消费额占人均工资收入的百分比约为83%.
5. B
解析:由题中散点图,可得图象是抛物线形状,则适宜作为y关于x的经验回归方程类型的是y=c+d(x>0).故选B.
6. A
解析:χ2==9.6>7.879=x0.005,故此推断犯错误的概率不超过0.005.
7. D
解析:D选项中,若该大学某女生身高为170 cm,则可预测,不可断定其体重约为0.85×170-85.71=58.79(kg).
故D选项错误.ABC都正确.
8. B
解析:由题意,设男生、女生的人数分别为5x,5x,建立列联表如下:
                  单位:人
性别 是否喜欢网络课程 合计
喜欢网络课程 不喜欢网络课程
男生 4x x 5x
女生 3x 2x 5x
合计 7x 3x 10x
由表中的数据,则χ2==,
由题意可得,6.635≤<10.828,即139.335≤10x<227.388,结合选项,故只有B选项符合要求.故选B.
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9. AB
解析:对于A,由样本数据得到的经验回归直线x+必过样本点的中心(),故选项A正确;
对于B,残差平方和越小的模型,拟合的效果越好,
故选项B正确;
对于C,用决定系数R2来刻画回归效果,R2越大,说明模型的拟合效果越好,故选项C错误;
对于D,若变量y和x之间的样本相关系数为r=-0.936 2,r的绝对值接近于1,则变量y和x之间线性相关程度很强,故选项D错误.
故选AB.
10. CD
解析:xi,+c,故A错误;
两组样本数据的样本中位数相差c,故B错误;
(xi-)2,[(xi+c)-(+c)]2=,故C正确;
x极差=xmax-xmin,y极差=(xmax+c)-(xmin+c)=xmax-xmin,故D正确.
11. BD
解析:对于A,P(走读生学习效率高)==20%,故选项A错误;
对于B,P(寄宿生学习效率高)==60%,故选项B正确;
因为χ2=≈16.667>10.828=x0.001,
所以根据小概率值α=0.001的独立性检验推断“学生学习效率高低与晚上睡眠是否充足有关”,此推断犯错误的概率不大于0.001,故选项C错误,选项D正确.
故选BD.
三、填空题:本题共3小题,每小题5分,共15分.请把正确答案填在题中的横线上.
12.①②③
解析:由经验回归方程=6x+6,可知A种棉花的产量与光照时长成正相关,故②正确;=3,,代入=6x+6,得=6×3+6,则m=22,故③正确;=24,则经验回归直线过点(3,24),故①正确;当x=11时,=6×11+6=72,则当光照时长为11小时时,A种棉花的产量约为72万吨,故④错误.
故填①②③.
13. 1.818 2
解析:由已知条件得=-1.818 2x+77.36,销售量每增加1千箱,则单位成本下降1.818 2元.
14. 106.5
解析:根据表中数据,计算×(2+4+5+6+8)=5,×(20+40+60+70+80)=54,代入经验回归方程=10.5x+中,求得=54-10.5×5=1.5,故经验回归方程为=10.5x+1.5,据此模型预测,x=10时,=10.5×10+1.5=106.5,即y的估计值是106.5.
四、解答题:本题共5小题,共77分.解答应写出必要的文字说明、证明过程或演算步骤.
15.解=1.03,,由=-91+100x,知=-91+100×1.03,解得a=11.
由于合格零件尺寸为1.03±0.01 cm,
故甲、乙加工的合格与不合格零件的数据表为
                 单位:个
机床 零件是不是合格 合计
合格 不合格
甲 24 6 30
乙 12 18 30
合计 36 24 60
零假设为H0:加工零件的质量与甲、乙两机床无关.
χ2===10>6.635=x0.01.
根据小概率值α=0.01的独立性检验,有充分证据推断H0不成立,
即认为加工零件的质量与甲、乙两机床有关,此推断犯错误的概率不大于0.01.
16
解(1)由数据可得×(1+2+3+4+5)=3,
×(17+38+59+80+106)=60,
xiyi=17×1+38×2+59×3+80×4+106×5=1 120,
=12+22+32+42+52=55,
所以=22,
故=60-22×3=-6,
所以y关于x的经验回归方程为=22x-6.
(2)由(1)知,当x=8时,=22×8-6=170,
因为每件T恤衫利润为20元,所以可以预测该商场第8天能获利20×170=3 400元.
17.解(1)由表中的数据,可知=3,=100,
所以=-9,
故=100-(-9)×3=127,
所以所求的经验回归方程为=-9x+127.
令x=10,则=-9×10+127=37.
(2)依题意得P(27≤X≤47)=P(35-2×4≤X≤35+3×4)≈0.954 5+=0.975 9.
(3)零假设为H0:是否使用这款App与性别无关.
由列联表中的数据可得χ2=≈7.143>6.635=x0.01.
依据小概率值α=0.01的χ2独立性检验,我们推断H0不成立,即认为是否使用这款App与性别有关.
18.
解(1)由题中数据可知,中青年对新高考了解的概率P=,中老年对新高考了解的概率P=.
(2)零假设为H0:对新高考的了解与年龄(中青年、中老年)无关.
列联表如下表所示.
                单位:人
年龄 是否了解新高考 合计
了解新高考 不了解新高考
中青年 22 8 30
中老年 8 12 20
合计 30 20 50
根据列联表中的数据,经计算得到
χ2=≈5.56>3.841=x0.05,
根据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,即认为对新高考的了解与年龄(中青年、中老年)有关,此推断犯错误的概率不大于0.05.
(3)年龄在区间[55,65)内的被调查者共5人,其中了解新高考的有2人,则抽取的3人中了解新高考的人数X可能取值为0,1,2,
则P(X=0)=;
P(X=1)=;
P(X=2)=.
所以X的分布列为
X 0 1 2
P
E(X)=0×+1×+2×.
19
解:(1)新数据对(xi,y'i)(i=1,2,3,4,5)如下表:
x 4 6 8 10 12
y' 1 2 3 5 6
因此=8,
'==3.4,
则==0.65,
=3.4-0.65×8=-1.8,
所以y'=0.65x-1.8.
(2)由(1)得,y=0.65x2-1.8x,当x1=4时,=4×(0.65×4-1.8)=3.2,
当x2=6时,=6×(0.65×6-1.8)=12.6,当x3=8时,=8×(0.65×8-1.8)=27.2,
当x4=10时,=10×(0.65×10-1.8)=47,当x5=12时,=12×(0.65×12-1.8)=72.
yi,对应值如下表:
y 4 12 24 50 72
3.2 12.6 27.2 47 72
所以v2=0.82+(-0.6)2+(-3.2)2+32+02=20.24,显然143.6>20.24,
所以模型y=c1x2+c2x拟合效果好.

展开更多......

收起↑

资源预览