2026年高考最后阶段冲刺训练 17统计与统计案例(含解析)

资源下载
  1. 二一教育资源

2026年高考最后阶段冲刺训练 17统计与统计案例(含解析)

资源简介

2026年高考最后阶段冲刺训练 17统计与统计案例(详解版)
训练要点:①随机抽样;②用样本估计总体;③变量间的相关关系;④回归分析;⑤独立性检验.
一、单选题
1.(2026·浙江杭州·二模)数据2,3,3,5,6,7,8,10的第70百分位数为( )
A.3 B.5 C.6 D.7
【答案】D
【详解】将数据从小到大排列:2,3,3,5,6,7,8,10,
因为,不是整数,
所以该组数据的第70百分位数为第6个数字,即7.
2.(2025·天津·二模)某地政府为了促进当地旅游,从到达该地旅游的游客中随机选取了400人进行调查,其中青年人、中年人、老年人三个年龄段的占比饼状图如图①所示,各年龄段游客的性别占比条形图如图②所示,则下列说法正确的是( )
A.估计到达该地旅游的女性占比约为55%
B.从调查的游客中,随机抽取一位进行深入调研,则抽到中年男性的概率为0.175
C.若按年龄进行分层,用分层随机抽样的方法从调查的游客中抽出20人分发纪念品,则中年人中应抽取8人
D.从调查的游客中选取一位作为幸运游客,在已知该幸运游客是青年人的条件下,其是女性的概率为0.6
【答案】B
【分析】根据题意,由三个年龄段的占比饼状图以及性别占比条形图,逐一判断,即可得到结果.
【详解】对于A,估计到达该地旅游的女性占比约为
,故A错误;
对于B,从调查的400人中,随机抽取一位进行深入调研,
则抽到中年男性的概率为,故B正确;
对于C,若按年龄进行分层,用分层随机抽样的方法从调查的游客中抽出20人分发纪念品,
则中年人中应抽取(人),故C错误;
对于D,从调查的游客中选取一位作为幸运游客,在已知该幸运游客是青年人的条件下,
其是女性的概率为0.7,故D错误.
故选:B.
3.(2024·陕西榆林·二模)某工厂要对1110个零件进行抽检,这1110个零件的编号为.若采用系统抽样的方法抽检30个零件,且编号为0005的零件被抽检,则下列编号是被抽检的编号的是( )
A.0040 B.0041 C.0042 D.0043
【答案】C
【分析】根据系统抽样的定义结合已知条件求出抽样间隔,从而可求得结果.
【详解】因为零件的个数为1110,抽取30个零件,
所以抽样间隔为,
因为编号为0005的零件被抽检,
所以所有被抽检的编号为,
所以当时,,得被抽检的编号可以是0042,
当时,,得被抽检的编号可以是0079,
故选:C
4.(2026·天津和平·二模)如图所示,某单峰频率分布直方图在右边“拖尾”,若由频率分布直方图估计样本数据的中位数为m,众数为n,平均数为p,则( )
A. B. C. D.
【答案】A
【分析】根据平均数,中位数,众数的概念结合图形分析判断.
【详解】由频率分布直方图可知,单峰不对称且右“拖尾”,最高峰偏左,众数最小.
平均数受极端值影响,与中位数相比,平均数总在“拖尾”那边,故平均数大于中位数,
故得.
5.(2026·河北·二模)某研究小组收集了60组关于“每天课外阅读时长(单位:分钟)”与“语文阅读理解得分(单位:分)”的数据,经计算,且由这60组数据拟合得到的经验回归方程为,则( )
A. B.12 C.1.2 D.12.84
【答案】C
【详解】解:.
6.(2026·湖北孝感·二模)为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
【答案】A
【详解】时的预测值,
时的真实为值,
样本点的残差为.
7.(2025·天津和平·三模)下列结论中不正确的是( )
A.已知随机变量,若,则
B.用决定系数来刻画回归的效果时,的值越接近1,说明模型拟合的效果越好
C.用0,1,2,3四个数字,组成有重复数字的三位数的个数为30
D.经验回归直线至少经过样本数据点中的一个点
【答案】D
【分析】由二项分布的期望与方差公式即可判断A;由决定系数的概念即可直接判断B;由分布乘法计数原理及间接法即可判断C;由经验回归方程有关性质即可直接判断D.
【详解】对于A,由二项分布的方差公式可知,
所以,所以,
所以二项分布的期望为,故A正确;
对于B,用来刻画回归效果,的值越接近于1,说明模型的拟合效果越好,的值越接近于0,说明模型的拟合效果越差,故B正确;
对于C,百位数字不能为0,有3种选择,个位和十位各有4种选择,利用分布乘法计数原理可得组成三位数的个数有种方法,其中没有重复数字的三位数的个数有种方法,所以组成有重复数字的三位数的个数为,故C正确;
对于D,在回归分析中,回归直线一定经过样本中心点,但不一定会经过样本数据点中的任何一个,故D错误;
故选:D.
8.(2025·甘肃金昌·二模)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
【答案】B
【分析】求得卡方值,比对临界值,逐个判断即可.
【详解】由题意,列出列联表:
接受 不接受 合计
男 40 60 100
女 20 80 100
合计 60 140 200
零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,
所以,
根据小概率值的独立性检验,我们推断不成立,
即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.
故选:B.
二、多选题
9.(2026·福建厦门·二模)为了研究某款新上市智能手环的直播间展示时长(单位:分钟)与即时下单量(单位:件)之间的关系,某电商平台随机记录了5场直播带货的数据,如下表所示:
直播间展示时长 1 2 3 4 5
即时下单量 12 18 25 30 34
若与的经验回归方程为,样本相关系数为,则( )
A.
B.回归直线过点
C.
D.当直播间展示时长为10分钟时,即时下单量的值估计为63
【答案】ACD
【详解】对于A,由数据可知,即时下单量随着直播间展示时长的增大而增大,
因此直播间展示时长与即时下单量为正相关,即样本相关系数,故A正确;
对于B,由数据可知,,,
则回归直线过中心点,不过点,故B错误;
对于C,将点代入,可得,解得,故C正确;
对于D,由C知,与的经验回归方程为,
则时,,故D正确.
10.(2026·广东惠州·二模)下列命题正确的是( )
A.数据4,4,4,6,6,7,8,8的众数是4
B.数据7,9,12,15,9,14,18的极差是11
C.数据2,3,3,5,7,8,9的第百分位数是6
D.数据的平均数为2,方差为4,则数据,的平均数为5,方差为16
【答案】ABD
【分析】根据众数的概念,可判断A的正误;根据极差的求法,可判断B的正误;根据百分位数的求法,可判断C的正误;根据平均数、方差的性质,可判断D的正误.
【详解】选项A:数据4,4,4,6,6,7,8,8的众数是4,故A正确;
选项B:数据7,9,12,15,9,14,18的极差是18-7=11,故B正确;
选项C:数据2,3,3,5,7,8,9共7个,,
则该组数据的第百分位数为7,故C错误;
选项D:数据,的平均数为,
方差为,故D正确.
11.(2025·河北保定·二模)防溺水安全教育不仅是为了防止学生在游泳时发生意外,更是为了提高学生的安全意识和自我保护能力,为此某校组织了“防溺水安全知识”答题比赛,并对参赛的200名学生的成绩进行了统计,得到如图所示的频率分布直方图,其中分组区间分别为,则(同一组中的数据用该组区间的中点值作代表)( )

A.这200名参赛学生的成绩的上四分位数为82.5分
B.这200名参赛学生的成绩的平均值为76.5分
C.这200名参赛学生的成绩不低于80分的频率为0.03
D.若用分层抽样的方法从参赛学生中抽取一个容量为40的样本,则成绩在之间的应抽取20人
【答案】ABD
【分析】对于A,根据上四分位数的概念,结合频率分布直方图的性质,可得其正误;对于B,根据频率分布直方图的数据,利用平均数估计值的计算,可得其正误;对于C,根据频率分布直方图的性质,可得其正误;对于D,根据分层抽样的概念,结合频率分布直方图的数据可得每组的比例,可得其正误.
【详解】因为.,
所以这200名参赛学生的成绩的上四分位数即第75百分位数位于内,
则这200名参赛学生的成绩的上四分位数为,故A正确;
这200名参赛学生的成绩的平均值为
分,故B正确;
这200名参赛学生的成绩不低于80分的频率为,故C错误;
成绩在之间的应抽取人,故D正确.
故选:ABD.
三、填空题
12.(2026·湖南衡阳·二模)已知样本数据的平均数为a,设,当函数取最小值时,_______.
【答案】1
【分析】根据题意,得到,结合和二次函数的性质,即可求解.
【详解】因为,
可得是一个图象开口向上的关于k的二次函数,
所以函数在其图象的对称轴处取得最小值,即,所以.
13.(2024·广东广州·一模)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为___________;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数___________.(参考公式:决定系数)
【答案】
【分析】根据回归直线方程必过样本中心点求出,即可求出,再根据决定系数公式求出.
【详解】因为,两边取对数可得,
又,,
依题意回归直线方程必过样本中心点,
所以,解得,所以,
又.
故答案为:;
14.(2025·上海杨浦·二模)植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期 3 9 11 17
植物高度 2.4 3.4 3.8 5.2
由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为__________厘米.
【答案】
【分析】根据表中数据求出线性回归方程,再代入即可.
【详解】由题意可得,,
所以,
所以回归方程为,
所以预测生长期是30天时,植物高度约为厘米.
故答案为:.
四、解答题
15.(2025·安徽滁州·二模)从某小区抽取户居民用户进行月用电量调查,发现他们的用电量都在之间,适当分组后结果整理如下表:
月用电量(kW·h) 用户数量 频率
20
0.3
40 0.2
由于表格受损,只能看到部分数据.
(1)求的值并计算月用电量不低于的居民用户的频率;
(2)为深入研究月用电量不低于的居民用户月用电情况,按分层随机抽样从中抽取了9户进行调查,求在这9户居民用户中随机抽取3户,恰有2户月用电量在区间内的概率.
【答案】(1),
(2)
【分析】(1)根据月用电量在内的用户数量及频率求得,再求出月用电量在区间内用户数量,进而得月用电量不低于用户数量,求出其频率即可;
(2)根据分层抽样方法,求出月用电量在区间,,的居民用户数,再根据古典概率求解方法求出概率即可.
【详解】(1),
月用电量在区间内的居民用户有户,
所以月用电量不低于的居民用户有户,
其频率为.
(2)月用电量在区间,,的居民用户各有户,
按分层随机抽样从中随机抽取9户,则月用电量在区间,,的居民用户各有3,4,2户,
从这9户居民用户中随机抽取3户,恰有2户居民用户月用电量在区间内的概率.
16.(2024·全国·模拟预测)某农业大学组织部分学生进行作物栽培试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速度,达到预期标准,小明对自己培育的一株作物使用了营养液,现统计了使用营养液十天之内该作物的高度变化
天数x 1 2 3 4 5 6 7 8 9 10
作物高度y/cm 9 10 10 11 12 13 13 14 14 14
(1)观察散点图可知,天数与作物高度之间具有较强的线性相关性,用最小二乘法求出作物高度关于天数的线性回归方程(其中用分数表示);
(2)小明测得使用营养液后第22天该作物的高度为,请根据(1)中的结果预测第22天该作物的高度的残差.
参考公式:.参考数据:.
【答案】(1);
(2).
【分析】(1)根据表格数据利用公式求出即可求解.
(2)将代入回归方程求得预测值,然后根据残差定义求解即可.
【详解】(1)依题意,,

故,
,故所求回归直线方程为.
(2)由(1)可知,当时,,
故所求残差为.
17.(2024·内蒙古包头·二模)某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升级投入(万元)与科技升级直接收益(万元)的数据统计如下:
序号 1 2 3 4 5 6 7
2 3 4 6 8 10 13
13 22 31 42 50 56 58
根据表格中的数据,建立了与的两个回归模型:模型①:模型②:.
(1)根据下列表格中的数据,比较模型① ②的相关指数的大小,并选择拟合精度更高 更可靠的模型;
(2)根据(1)选择的模型,预测对该产品科技升级的投入为100万元时的直接收益.
回归模型 模型① 模型②
回归方程
182.4 79.2
(附:刻画回归效果的相关指数越大,模型的拟合效果越好)
【答案】(1)模型①的相关指数小于模型②的相关指数,即模型②的拟合效果精度更高 更可靠.
(2)198.6
【分析】(1)利用相关指数的定义判断相关性即可.
(2)将给定数值代入拟合模型中求预测值即可.
【详解】(1)由表格中的数据,,
所以,模型①的相关指数小于模型②的相关指数,
即模型②的拟合效果精度更高 更可靠.
(2)当万元时,科技升级直接收益的预测值为:
(万元)
18.(2023·广东汕头·二模)车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.某实验室通过试验测得行驶里程与某品牌轮胎凹槽深度的数据如下:
行驶里程/万km 0.00 0.64 1.29 1.93 2.57 3.22 3.86 4.51 5.15
轮胎凹槽深度/mm 10.02 8.37 7.39 6.48 5.82 5.20 4.55 4.16 3.82
以行驶里程为横坐标、轮胎凹槽深度为纵坐标作散点图,如图所示.
(1)根据散点图,可认为散点集中在直线附近,由此判断行驶里程与轮胎凹槽深度线性相关,并计算得如下数据,请求出行驶里程与轮胎凹槽深度的相关系数(保留两位有效数字),并推断它们线性相关程度的强弱;
2.57 6.20 115.10 29.46
附:相关系数
(2)通过散点图,也可认为散点集中在曲线附近,考虑使用对数回归模型,并求得经验回归方程及该模型的决定系数.已知(1)中的线性回归模型为,在同一坐标系作出这两个模型,据图直观回答:哪个模型的拟合效果更好?并用决定系数验证你的观察所得.
附:线性回归模型中,决定系数等于相关系数的平方,即.
【答案】(1),相关性较强
(2)答案见解析
【分析】(1)直接根据相关系数的计算公式求得,从而可判断相关性较强;
(2)由图像可直观判断,再求出线性回归模型的决定系数,从而可判断对数回归模型的拟合度更高.
【详解】(1)由题意,,
∵,∴,
∴行驶里程与轮胎凹楳深度成负相关,且相关性较强.
(2)由图像可知,车胎凹槽深度与对数回归预报值残差、偏离更小,拟合度更高,线性回归预报值偏美较大.
由题(1)得线性回归模型的相关系数,
决定系数,
由题意,对数回归模型的决定系数,
∵,∴对数回归模型的拟合度更高.
19.(2026·河北邯郸·二模)2026年马年春晚是大模型与节目结合最多的一场春晚,其中大模型“豆包”贯穿整场晚会.为了了解人们对大模型“豆包”应用的关注程度,现随机抽取不同年龄段的1000人进行调查统计,得到如下列联表:
年龄 “豆包”应用 合计
不关注 关注
不超过50岁 400 600
超过50岁 300
合计 1000
(1)完成列联表,并依据小概率值的独立性检验,判断人们对大模型“豆包”应用的关注程度是否与年龄有关联;
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,从这6人中随机抽取2人做进一步的访谈,记抽到的2人中关注“豆包”应用的人数为X,求X的分布列和数学期望.
附:,其中.
α 0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)列联表见解析,依据小概率值的独立性检验,可判断人们对大模型“豆包”应用的关注程度与年龄有关联.
(2)分布列见解析;
【分析】(1)补全列联表,进行零假设,求出,根据附表进行判断;
(2)根据超几何分布的特征,写出变量的分布列,根据分布列求出变量的数学期望.
【详解】(1)(1)补全的列联表如下:
年龄 “豆包”应用 合计
不关注 关注
不超过50岁 200 400 600
超过50岁 300 100 400
合计 500 500 1000
零假设为:人们对大模型“豆包”应用的关注程度与年龄无关.
根据表中数据,计算得到.
根据小概率值的独立性检验,没有充分证据推断成立,
即认为人们对大模型“豆包”应用的关注程度与年龄有关,该推断犯错误的概率不超过0.001.
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,
则关注“豆包”应用的有人,不关注“豆包”应用的有人,
则的所有可能取值为0,1,2,
的分布列为
0 1 2
的数学期望.
试卷第1页,共3页
试卷第1页,共3页2026年高考最后阶段冲刺训练 17统计与统计案例(学生版)
训练要点:①随机抽样;②用样本估计总体;③变量间的相关关系;④回归分析;⑤独立性检验.
1.(2026·浙江杭州·二模)数据2,3,3,5,6,7,8,10的第70百分位数为( )
A.3 B.5 C.6 D.7
2.(2025·天津·二模)某地政府为了促进当地旅游,从到达该地旅游的游客中随机选取了400人进行调查,其中青年人、中年人、老年人三个年龄段的占比饼状图如图①所示,各年龄段游客的性别占比条形图如图②所示,则下列说法正确的是( )
A.估计到达该地旅游的女性占比约为55%
B.从调查的游客中,随机抽取一位进行深入调研,则抽到中年男性的概率为0.175
C.若按年龄进行分层,用分层随机抽样的方法从调查的游客中抽出20人分发纪念品,则中年人中应抽取8人
D.从调查的游客中选取一位作为幸运游客,在已知该幸运游客是青年人的条件下,其是女性的概率为0.6
3.(2024·陕西榆林·二模)某工厂要对1110个零件进行抽检,这1110个零件的编号为.若采用系统抽样的方法抽检30个零件,且编号为0005的零件被抽检,则下列编号是被抽检的编号的是( )
A.0040 B.0041 C.0042 D.0043
4.(2026·天津和平·二模)如图所示,某单峰频率分布直方图在右边“拖尾”,若由频率分布直方图估计样本数据的中位数为m,众数为n,平均数为p,则( )
A. B. C. D.
5.(2026·河北·二模)某研究小组收集了60组关于“每天课外阅读时长(单位:分钟)”与“语文阅读理解得分(单位:分)”的数据,经计算,且由这60组数据拟合得到的经验回归方程为,则( )
A. B.12 C.1.2 D.12.84
6.(2026·湖北孝感·二模)为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
7.(2025·天津和平·三模)下列结论中不正确的是( )
A.已知随机变量,若,则
B.用决定系数来刻画回归的效果时,的值越接近1,说明模型拟合的效果越好
C.用0,1,2,3四个数字,组成有重复数字的三位数的个数为30
D.经验回归直线至少经过样本数据点中的一个点
8.(2025·甘肃金昌·二模)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
二、多选题
9.(2026·福建厦门·二模)为了研究某款新上市智能手环的直播间展示时长(单位:分钟)与即时下单量(单位:件)之间的关系,某电商平台随机记录了5场直播带货的数据,如下表所示:
直播间展示时长 1 2 3 4 5
即时下单量 12 18 25 30 34
若与的经验回归方程为,样本相关系数为,则( )
A.
B.回归直线过点
C.
D.当直播间展示时长为10分钟时,即时下单量的值估计为63
10.(2026·广东惠州·二模)下列命题正确的是( )
A.数据4,4,4,6,6,7,8,8的众数是4
B.数据7,9,12,15,9,14,18的极差是11
C.数据2,3,3,5,7,8,9的第百分位数是6
D.数据的平均数为2,方差为4,则数据,的平均数为5,方差为16
11.(2025·河北保定·二模)防溺水安全教育不仅是为了防止学生在游泳时发生意外,更是为了提高学生的安全意识和自我保护能力,为此某校组织了“防溺水安全知识”答题比赛,并对参赛的200名学生的成绩进行了统计,得到如图所示的频率分布直方图,其中分组区间分别为,则(同一组中的数据用该组区间的中点值作代表)( )

A.这200名参赛学生的成绩的上四分位数为82.5分
B.这200名参赛学生的成绩的平均值为76.5分
C.这200名参赛学生的成绩不低于80分的频率为0.03
D.若用分层抽样的方法从参赛学生中抽取一个容量为40的样本,则成绩在之间的应抽取20人
三、填空题
12.(2026·湖南衡阳·二模)已知样本数据的平均数为a,设,当函数取最小值时,_______.
13.(2024·广东广州·一模)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为___________;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数___________.(参考公式:决定系数)
14.(2025·上海杨浦·二模)植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期 3 9 11 17
植物高度 2.4 3.4 3.8 5.2
由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为__________厘米.
四、解答题
15.(2025·安徽滁州·二模)从某小区抽取户居民用户进行月用电量调查,发现他们的用电量都在之间,适当分组后结果整理如下表:
月用电量(kW·h) 用户数量 频率
20
0.3
40 0.2
由于表格受损,只能看到部分数据.
(1)求的值并计算月用电量不低于的居民用户的频率;
(2)为深入研究月用电量不低于的居民用户月用电情况,按分层随机抽样从中抽取了9户进行调查,求在这9户居民用户中随机抽取3户,恰有2户月用电量在区间内的概率.
16.(2024·全国·模拟预测)某农业大学组织部分学生进行作物栽培试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速度,达到预期标准,小明对自己培育的一株作物使用了营养液,现统计了使用营养液十天之内该作物的高度变化
天数x 1 2 3 4 5 6 7 8 9 10
作物高度y/cm 9 10 10 11 12 13 13 14 14 14
(1)观察散点图可知,天数与作物高度之间具有较强的线性相关性,用最小二乘法求出作物高度关于天数的线性回归方程(其中用分数表示);
(2)小明测得使用营养液后第22天该作物的高度为,请根据(1)中的结果预测第22天该作物的高度的残差.
参考公式:.参考数据:.
17.(2024·内蒙古包头·二模)某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升级投入(万元)与科技升级直接收益(万元)的数据统计如下:
序号 1 2 3 4 5 6 7
2 3 4 6 8 10 13
13 22 31 42 50 56 58
根据表格中的数据,建立了与的两个回归模型:模型①:模型②:.
(1)根据下列表格中的数据,比较模型① ②的相关指数的大小,并选择拟合精度更高 更可靠的模型;
(2)根据(1)选择的模型,预测对该产品科技升级的投入为100万元时的直接收益.
回归模型 模型① 模型②
回归方程
182.4 79.2
(附:刻画回归效果的相关指数越大,模型的拟合效果越好)
18.(2023·广东汕头·二模)车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.某实验室通过试验测得行驶里程与某品牌轮胎凹槽深度的数据如下:
行驶里程/万km 0.00 0.64 1.29 1.93 2.57 3.22 3.86 4.51 5.15
轮胎凹槽深度/mm 10.02 8.37 7.39 6.48 5.82 5.20 4.55 4.16 3.82
以行驶里程为横坐标、轮胎凹槽深度为纵坐标作散点图,如图所示.
(1)根据散点图,可认为散点集中在直线附近,由此判断行驶里程与轮胎凹槽深度线性相关,并计算得如下数据,请求出行驶里程与轮胎凹槽深度的相关系数(保留两位有效数字),并推断它们线性相关程度的强弱;
2.57 6.20 115.10 29.46
附:相关系数
(2)通过散点图,也可认为散点集中在曲线附近,考虑使用对数回归模型,并求得经验回归方程及该模型的决定系数.已知(1)中的线性回归模型为,在同一坐标系作出这两个模型,据图直观回答:哪个模型的拟合效果更好?并用决定系数验证你的观察所得.
附:线性回归模型中,决定系数等于相关系数的平方,即.
19.(2026·河北邯郸·二模)2026年马年春晚是大模型与节目结合最多的一场春晚,其中大模型“豆包”贯穿整场晚会.为了了解人们对大模型“豆包”应用的关注程度,现随机抽取不同年龄段的1000人进行调查统计,得到如下列联表:
年龄 “豆包”应用 合计
不关注 关注
不超过50岁 400 600
超过50岁 300
合计 1000
(1)完成列联表,并依据小概率值的独立性检验,判断人们对大模型“豆包”应用的关注程度是否与年龄有关联;
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,从这6人中随机抽取2人做进一步的访谈,记抽到的2人中关注“豆包”应用的人数为X,求X的分布列和数学期望.
附:,其中.
α 0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
试卷第1页,共3页
试卷第1页,共3页

展开更多......

收起↑

资源列表