2026年高考数学-压轴强化训练压轴23概率与统计综合问题的(3大核心压轴题型精讲+压轴强化训练)(学生版+解析)

资源下载
  1. 二一教育资源

2026年高考数学-压轴强化训练压轴23概率与统计综合问题的(3大核心压轴题型精讲+压轴强化训练)(学生版+解析)

资源简介

压轴23 概率与统计综合问题的3大核心题型
统计与概率的综合问题是命制生活实践情境类试题的最佳切入点,所考查内容涉及数据分析、数学建模、数学运算、逻辑推理等核心素养,是近几年高考追逐的热点之一,处理此类问题的关键是把握概率、统计的本质,合理构造模型,正确进行数学运算和必要的逻辑推理.
题型01 概率与统计图表的综合
1.(2025·北京朝阳·二模)某电商平台为了解用户对配送服务的满意度,分别从A地区和B地区随机抽取了500名和100名用户进行问卷评分调查,将评分数据按,,…,分组整理得到如下频率分布直方图:
(1)从A地区抽取的500名用户中随机抽取一名,求该用户评分不低于60分的概率;
(2)从B地区评分为的样本中随机抽取两名,记评分不低于90分的用户人数为X,求X的分布列和数学期望;
(3)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,设A地区评分的平均值估计为,A,B两地区评分的平均值估计为,比较与的大小关系.(直接写出结论)
2.(2025·广东广州·三模)为减少环境污染,保护生态环境,某校进行了“垃圾分类知识普及活动”,并对高一、高二全体学生进行了相关知识测试.现从高一、高二各随机抽取了20名学生,对他们的成绩(百分制)进行了整理和分析后得到如下信息:
高一年级成绩分布表
成绩
人数 1 2 3 4 10
高二年级成绩频率分布直方图
(1)从高一和高二样本中各抽取一人,求这两人成绩都不低于90分的概率;
(2)用频率估计概率,分别从高一全体学生中抽取一人,从高二全体学生中抽取两人,随机变量表示这三人中成绩不低于90分的人数,求的分布列和数学期望.
题型02 概率与独立性检验的综合
3.(2025·辽宁本溪一模)电信诈骗是指通过电话 网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程 非接触式诈骗的犯罪行为.为打击电信诈骗犯罪活动,我国各地积极开展各类“反诈”知识宣传,并取得了显著的效果.某社区为调查该社区市民对“反诈”知识的熟悉情况,进行了一次抽样调查.调查结果如列联表所示.
性别 是否熟悉“反诈”知识 合计
不熟悉 熟悉
男 24 16 40
女 12 48 60
合计 36 64 100
(1)依据小概率值的独立性检验,能否认为该社区市民是否熟悉“反诈”知识与性别有关?
(2)为了增强市民的防范意识,该社区举办了一次“反诈”知识竞赛.已知参加本次知识竞赛的市民的竞赛成绩X近似服从正态分布,若有15.865%的参赛市民的成绩低于本次知识竞赛预期的平均成绩,试估计本次知识竞赛预期的平均成绩;
(3)为了进一步增强市民的“反诈”意识,参加了知识竞赛的市民可继续参加该社区组织的答题赠话费活动,活动规则如下:每人需回答3道题,每答对一道题获得30元话费.已知参加了知识竞赛的市民小王答对每道题的概率均为,且每道题答对与否相互独立,记小王获得话费为元,求的期望和方差.
参考公式
0.1 0.05 0.01 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
参考数据:若随机变量则
4.(2025·上海静安·三模)“赶大集”出圈彰显了传统民俗的独特魅力.为了解年轻人对“赶大集”的态度,随机调查了200位年轻人,得到的统计数据如下面的不完整的2×2列联表所示(单位:人).
非常喜欢 感觉一般 合计
男性 3t 100
女性 t
合计 60
(1)求t的值,试根据小概率的独立性检验,能否认为年轻人对“赶大集”的态度与性别有关;
(2)从样本中筛选出5名男性和3名女性共8人作为代表,这8名代表中有2名男性和2名女性非常喜欢“赶大集”.现从这8名代表中任选3名男性和2名女性进一步交流,记X为这5人中非常喜欢“赶大集”的人数,求X的分布列及数学期望.
参考公式:,其中.
0.1 0.05 0.01 …
2.706 3.841 6.635 …
题型03 概率与回归分析的综合
5.(2025·山东淄博·二模)汽车尾气排放超标是导致全球变暖、海平面上升的重要因素.我国近几年着重强调可持续发展,加大新能源项目的支持力度,积极推动新能源汽车产业迅速发展.某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统计表:
年份t 2015 2016 2017 2018 2019
年份代码x(x=t﹣2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
(1)计算销量y关于年份代码x的线性相关系数r,并判断是否可以认为y与x有较强的线性相关关系(若|r|≥0.75,则认为有较强的线性相关关系).若是,求出y关于x的线性回归方程:若不是,说明理由;
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业又随机调查了该地区100位购车车主的购车情况,假设一位车主只购一辆车.男性车主中购置传统燃油汽车的有40名,购置新能源汽车的有30名:女性车主中有一半购置新能源汽车.将频率视为概率,已知一位车主购得新能源汽车,请问这位车主是女性的概率.
附:若为样本点,
相关系数公式:r;为回归方程,则,.
6.(2026·河南郑州二模)某高中数学兴趣小组,在学习了统计案例后,准备利用所学知识研究成年男性的臂长y(cm)与身高x(cm)之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:
x 159 165 170 176 180
y 67 71 73 76 78
(1)根据上表数据,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)建立y关于x的回归方程(系数精确到0.01);
(3)从5名样本成年男性中任取2人,记这2人臂长差的绝对值为X,求.
参考数据:,,
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
1.(2025·云南曲靖一模)某学校对高中生体质健康调研,随机抽取100名学生的体重(单位:kg)得到如下频数分布表:
分组
频数 5 25 40 20 10
(1)估计样本的中位数;
(2)从样本和中按分层抽样抽取学生6人,再从这6人中随机抽取3人,其中体重在,的人数分别为,,记.
(i)求的分布列及期望;
(ii)求.
2.(2025·江苏徐州二模)某品牌新能源汽车在某城市2024年1月至5月的销售量如下表所示:
月份x 1 2 3 4 5
销售量y/辆 32 48 63 80 107
(1)求y关于x的经验回归方程;
(2)用(1)中所求的方程来拟合数据时,定义残差的绝对值大于3的一对数据为“异常数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“异常数据”的对数X的概率分布和数学期望.
附:经验回归直线中斜率和截距的最小二乘估计公式分别为:.
3.(2025·海南·模拟预测)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线l上有自东向西依次编号为1,2,…,21的21个车站.
(1)为调查乘客对调图的满意度,在编号为10和11两个站点多次乘坐列车的旅客中,随机抽取100名旅客,得出数据(不完整)如下表所示:
车站编号 满意 不满意 合计
10 35 50
11 30
合计 55
完善表格数据并计算分析:依据小概率值的独立性检验,在这两个车站中,能否认为旅客满意程度与车站编号有关联?
(2)根据以往调图经验,列车在编号为8至14的终到站每次调图时有的概率改为当前终到站的西侧一站,有的概率改为当前终到站的东侧一站,每次调图之间相互独立.已知原定终到站编号为11的列车经历了3次调图,第3次调图后的终到站编号记为,求的分布列及均值.
附,其中.
0.1 0.01 0.001
2.706 6.635 10.828
4.(2025·甘肃白银·二模)从全校学生中随机选取100人,统计了他们在寒假期间,一周参加体育锻炼的时间(单位:小时),分别位于区间,,,,,,用频率分布直方图表示如图,假设用频率估计概率,且每个学生参加课后活动的时间相互独立.
(1)求a的值,并估计全校学生在寒假期间一周参加体育锻炼的时间位于区间的概率;
(2)完成列联表,并依据小概率值的独立性检验,能否认为性别与学生在寒假期间一周参加体育锻炼的时间有关联?
(3)以频率作为概率,从全校学生中随机选取3人,记X表示这3人寒假期间一周参加体育锻炼的时间在区间的人数,求X的分布列和数学期望.
锻炼时间 合计
男生 30
女生 25
合计 100
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
5.(2026·陕西商洛·二模)汉中藤编久负盛名,被列入国家非物质文化遗产.一根藤,牵起千年的记忆,也编织出乡村振兴的新图景.汉中某藤编制作工坊积极探索线上推广渠道,藤编产品销量逐年增长.该工坊为了科学规划生产,统计了2021-2025年藤编产品的销量数据如下表:
年份年 2021 2022 2023 2024 2025
年份代码 1 2 3 4 5
销量/万件 6 7 10 12 15
(1)统计表明销量与年份代码有较强的线性相关关系,求关于的线性回归方程,并预测该工坊2026年藤编产品的销量;
(2)已知该工坊2025年售出的藤编产品中,有9万件通过线上售出,用频率估计概率,现从2025年售出的藤编产品中随机抽取4件,求其中线上售出数量的分布列及数学期望.
附:为回归直线方程,其中.
6.(2026·重庆·一模)某地区从高一年级的物理测试中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图.
(1)该地区某学校建议此次物理测试成绩在本地区前的学生选科报物理方向,试估计报物理方向的学生本次成绩不低于多少分?(结果保留整数)
(2)从成绩位于区间和的答卷中,采用分层抽样随机抽取7份,再从这7份中随机抽取3份,设成绩在的答卷份数为随机变量,求的分布列及数学期望.
7.(2026·河北承德·一模)2025年9月3日在天安门广场举行纪念中国人民抗日战争暨世界反法西斯战争胜利80周年阅兵式,这不仅是一场军事盛宴,更是一次民族精神的洗礼.某中学为了增强学生的爱国主义情怀,减轻学习压力,决定组织一次军事知识竞赛.为了了解学生喜欢军事是否与性别有关,随机抽取了100名学生进行调查,已知女生中有15名喜欢军事,男生中有的人喜欢军事,喜欢军事的学生中有是男生.参加竞赛的学生从喜欢军事的学生中选取,测试题型分为选择题与填空题两种,每次由电脑随机选出一道,选择题与填空题出现的频率之比为,已知学生答对选择题的概率为,答对填空题的概率为,每次答题互不影响.
喜欢军事 不喜欢军事 合计
男生
女生 15
合计
(1)根据已知条件补充完整上表,并根据小概率值的独立性检验,分析该校学生喜欢军事是否与性别有关;
(2)若每位学生答3题,求该学生答对题数X的分布列和数学期望.
附:,其中.
8.(2026·江苏镇江·一模)AI幻觉,是指AI模型生成看似合理但实际不正确或毫无事实依据的信息的现象,AI幻觉率是指AI模型产生AI幻觉的概率.现抽取了某公司研发的14个使用率较高的AI模型,其幻觉率如下表所示:
AI模型 1 2 3 4 5 6 7 8 9 10 11 12 13 14
幻觉率 1.3% 1.8% 2.9% 1.5% 1.9% 2.9% 0.7% 0.9% 1.6% 2.4% 0.8% 1.6% 2.4% 2.8%
(1)从表中提供的AI模型中任取一个,求该模型幻觉率小于2%的概率;
(2)从表中提供的幻觉率小于的AI模型中任取3个,用随机变量表示其中幻觉率小于的模型个数,求随机变量的分布列和数学期望.
9.(2026·湖南邵阳·二模)为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法从甲、乙两所学校共抽取120名学生.通过测验得到如下数据:甲校50名学生中有10名学生的数学成绩优秀;乙校70名学生中有10名学生的数学成绩优秀.根据抽样数据的分析,得到不完整抽样数据列联表,如表(一)所示.
单位:人
学校 数学成绩 合计
不优秀 优秀
甲校 10 50
乙校 10 70
合计
表(一)
(1)完成表(一)列联表,依据小概率值的独立性检验,能否据此推断两校学生的数学成绩优秀率有差异?
(2)已知甲、乙两所学校利用AI自习室帮助数学不优秀的学生进行成绩有效转化,且转化数据如下:甲校数学不优秀学生成绩有效转化的概率为,乙校数学不优秀学生成绩有效转化的概率为.若从甲、乙两所学校数学不优秀的学生中采用随机抽样的方式抽出1名学生,用样本估计总体,用频率估计概率,求该学生数学成绩有效转化的概率.
参考公式与数据:
,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
10.(2026·贵州毕节·二模)某电商公司为研究直播带货中平台流量推广投入x(单位:万元)与销售额y(单位:万元)的关系,统计了最近10场直播带货中平台流量推广投入和销售额数据,计算得:,.
(1)求销售额y关于直播带货中平台流量推广投入x的线性回归方程;
(2)该公司计划下一场直播投入总额10万元,现有两种方案:方案一:全部用于平台流量推广;方案二:部分用于平台流量推广,部分用于主播佣金激励.其中平台流量推广投入x万元(),主播佣金激励投入()万元.根据以往经验,主播佣金激励投入t万元的销售额为()万元;平台流量推广的效果仍符合(1)中的回归方程.比较两种方案,如何分配投入才能使销售额最大?并求出最大销售额.
参考公式:线性回归方程中,,.
21世纪教育网(www.21cnjy.com)
21世纪教育网(www.21cnjy.com)压轴23 概率与统计综合问题的3大核心题型
统计与概率的综合问题是命制生活实践情境类试题的最佳切入点,所考查内容涉及数据分析、数学建模、数学运算、逻辑推理等核心素养,是近几年高考追逐的热点之一,处理此类问题的关键是把握概率、统计的本质,合理构造模型,正确进行数学运算和必要的逻辑推理.
题型01 概率与统计图表的综合
1.(2025·北京朝阳·二模)某电商平台为了解用户对配送服务的满意度,分别从A地区和B地区随机抽取了500名和100名用户进行问卷评分调查,将评分数据按,,…,分组整理得到如下频率分布直方图:
(1)从A地区抽取的500名用户中随机抽取一名,求该用户评分不低于60分的概率;
(2)从B地区评分为的样本中随机抽取两名,记评分不低于90分的用户人数为X,求X的分布列和数学期望;
(3)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,设A地区评分的平均值估计为,A,B两地区评分的平均值估计为,比较与的大小关系.(直接写出结论)
【解】(1)设事件M:从A地区抽取的500名用户中随机抽取一名,该用户评分不低于分.
由频率分布直方图可知,A地区抽取的500名用户中评分不低于的人数为,
所以.
(2)B地区评分为的样本用户共有人,
其中评分不低于分的人数为5人.
由题意可知,X的所有可能取值为0,1,2.



所以X的分布列为:
X 0 1 2
P
则X的数学期望.
(3).
根据频率分布直方图A地区评分的平均值为,
B地区评分的平均值为,
所以A,B两地区评分的平均值;
2.(2025·广东广州·三模)为减少环境污染,保护生态环境,某校进行了“垃圾分类知识普及活动”,并对高一、高二全体学生进行了相关知识测试.现从高一、高二各随机抽取了20名学生,对他们的成绩(百分制)进行了整理和分析后得到如下信息:
高一年级成绩分布表
成绩
人数 1 2 3 4 10
高二年级成绩频率分布直方图
(1)从高一和高二样本中各抽取一人,求这两人成绩都不低于90分的概率;
(2)用频率估计概率,分别从高一全体学生中抽取一人,从高二全体学生中抽取两人,随机变量表示这三人中成绩不低于90分的人数,求的分布列和数学期望.
【解】(1)从高一年级成绩分布表可以看出,成绩不低于90分的概率为.
从高二年级成绩频率分布直方图中可以看出,成绩不低于90分的概率为.
所以从高一和高二样本中各抽取1人,这两人的成绩都不低于90分的概率为:.
(2)根据题意可知,的可能取值为0,1,2,3.
当时,即这三个人中成绩都低于90分,此时概率为:
.
当时,即这三个人中成绩只有1人的成绩是不低于90分的,此时概率为:
.
当时,即这三个人中成绩只有2人的成绩是不低于90分的,此时概率为:
.
当时,即这三个人的成绩都是不低于90分的,此时概率为:
.
所以的分布列为:
0 1 2 3
所以数学期望为.
题型02 概率与独立性检验的综合
3.(2025·辽宁本溪一模)电信诈骗是指通过电话 网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程 非接触式诈骗的犯罪行为.为打击电信诈骗犯罪活动,我国各地积极开展各类“反诈”知识宣传,并取得了显著的效果.某社区为调查该社区市民对“反诈”知识的熟悉情况,进行了一次抽样调查.调查结果如列联表所示.
性别 是否熟悉“反诈”知识 合计
不熟悉 熟悉
男 24 16 40
女 12 48 60
合计 36 64 100
(1)依据小概率值的独立性检验,能否认为该社区市民是否熟悉“反诈”知识与性别有关?
(2)为了增强市民的防范意识,该社区举办了一次“反诈”知识竞赛.已知参加本次知识竞赛的市民的竞赛成绩X近似服从正态分布,若有15.865%的参赛市民的成绩低于本次知识竞赛预期的平均成绩,试估计本次知识竞赛预期的平均成绩;
(3)为了进一步增强市民的“反诈”意识,参加了知识竞赛的市民可继续参加该社区组织的答题赠话费活动,活动规则如下:每人需回答3道题,每答对一道题获得30元话费.已知参加了知识竞赛的市民小王答对每道题的概率均为,且每道题答对与否相互独立,记小王获得话费为元,求的期望和方差.
参考公式
0.1 0.05 0.01 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
参考数据:若随机变量则
【解】(1)零假设为:该社区市民是否熟悉“反诈”知识与性别无关,
经计算得,
所以依据小概率值的独立性检验,推断不成立,
即可认为该社区市民是否熟悉“反诈”知识与性别有关,此推断犯错误的概率不超过0.001.
(2)因为,
又,,
故本次知识竞赛预期的平均成绩大约为83.
(3)记小王答对题的数量为,则,由题意得,
则,所以,
.
4.(2025·上海静安·三模)“赶大集”出圈彰显了传统民俗的独特魅力.为了解年轻人对“赶大集”的态度,随机调查了200位年轻人,得到的统计数据如下面的不完整的2×2列联表所示(单位:人).
非常喜欢 感觉一般 合计
男性 3t 100
女性 t
合计 60
(1)求t的值,试根据小概率的独立性检验,能否认为年轻人对“赶大集”的态度与性别有关;
(2)从样本中筛选出5名男性和3名女性共8人作为代表,这8名代表中有2名男性和2名女性非常喜欢“赶大集”.现从这8名代表中任选3名男性和2名女性进一步交流,记X为这5人中非常喜欢“赶大集”的人数,求X的分布列及数学期望.
参考公式:,其中.
0.1 0.05 0.01 …
2.706 3.841 6.635 …
【解】(1)由题意可知:,解得,
2×2列联表如下:
非常喜欢 感觉一般 合计
男性 60 40 100
女性 80 20 100
合计 140 60 200
.
根据小概率值的独立性检验,认为年轻人对“赶大集”的态度与性别有关,
此推断犯错误的概率不大于0.01.
(2)设进一步交流的男性中非常喜欢“赶大集”的人数为m,女性中非常喜欢“赶大集”的人数为n,
则,且X的所有可能取值为1,2,3,4.



.
所以X的分布列为
X 1 2 3 4
P
所以.
题型03 概率与回归分析的综合
5.(2025·山东淄博·二模)汽车尾气排放超标是导致全球变暖、海平面上升的重要因素.我国近几年着重强调可持续发展,加大新能源项目的支持力度,积极推动新能源汽车产业迅速发展.某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统计表:
年份t 2015 2016 2017 2018 2019
年份代码x(x=t﹣2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
(1)计算销量y关于年份代码x的线性相关系数r,并判断是否可以认为y与x有较强的线性相关关系(若|r|≥0.75,则认为有较强的线性相关关系).若是,求出y关于x的线性回归方程:若不是,说明理由;
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业又随机调查了该地区100位购车车主的购车情况,假设一位车主只购一辆车.男性车主中购置传统燃油汽车的有40名,购置新能源汽车的有30名:女性车主中有一半购置新能源汽车.将频率视为概率,已知一位车主购得新能源汽车,请问这位车主是女性的概率.
附:若为样本点,
相关系数公式:r;为回归方程,则,.
【解】(1)由题意得,



因此,销量与年份代码有较强的线性相关关系:


关于的线性回归方程为.
(2)由题意知,该地区名购车车主中,男车主有名,女性车主有名,购置新能源汽车的男性车主有名,购置新能源汽车的女性车主有名.
“一位车主购得新能源汽车”记作事件,“车主是女性”记作事件,
一位车主购得新能源汽车,这位车主是女性的概率为:
6.(2026·河南郑州二模)某高中数学兴趣小组,在学习了统计案例后,准备利用所学知识研究成年男性的臂长y(cm)与身高x(cm)之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:
x 159 165 170 176 180
y 67 71 73 76 78
(1)根据上表数据,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)建立y关于x的回归方程(系数精确到0.01);
(3)从5名样本成年男性中任取2人,记这2人臂长差的绝对值为X,求.
参考数据:,,
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
【解】(1)由表中的数据和附注中的参考数据得
,,,,

,,
∴.
因为y与x的相关系数近似为0.997,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.
(2)由及(1)得,

所以y关于x的回归方程为.
(3)X的取值依次为2,3,4,5,6,7,9,11,
,,,
,,,
,,
X的分布列
X
所以
1.(2025·云南曲靖一模)某学校对高中生体质健康调研,随机抽取100名学生的体重(单位:kg)得到如下频数分布表:
分组
频数 5 25 40 20 10
(1)估计样本的中位数;
(2)从样本和中按分层抽样抽取学生6人,再从这6人中随机抽取3人,其中体重在,的人数分别为,,记.
(i)求的分布列及期望;
(ii)求.
【解】(1)因为,,
故样本的中位数落在内,
又,故中位数为
(2)(i)和的人数比为,
分层抽样抽取学生6人中,和的人数分别为和,
故这6人中随机抽取3人,的可能取值为,对应的的取值为,
所以的可能取值为,
,,,
故的分布列为
期望为,
(ii)由(i)知

所以.
2.(2025·江苏徐州二模)某品牌新能源汽车在某城市2024年1月至5月的销售量如下表所示:
月份x 1 2 3 4 5
销售量y/辆 32 48 63 80 107
(1)求y关于x的经验回归方程;
(2)用(1)中所求的方程来拟合数据时,定义残差的绝对值大于3的一对数据为“异常数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“异常数据”的对数X的概率分布和数学期望.
附:经验回归直线中斜率和截距的最小二乘估计公式分别为:.
【解】(1)由表格可得,,

所以,
故y关于x的经验回归方程是.
(2)当时,,残差的绝对值为;
当时,,残差的绝对值为;
当时,,残差的绝对值为;
当时,,残差的绝对值为;
当时,,残差的绝对值为.
所以“异常数据”为第四对和第五对共2对数据,
故“异常数据”的对数X的所有可能取值为0,1,2,

所以X的概率分布如下:
X 0 1 2
P
数学期望.
3.(2025·海南·模拟预测)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线l上有自东向西依次编号为1,2,…,21的21个车站.
(1)为调查乘客对调图的满意度,在编号为10和11两个站点多次乘坐列车的旅客中,随机抽取100名旅客,得出数据(不完整)如下表所示:
车站编号 满意 不满意 合计
10 35 50
11 30
合计 55
完善表格数据并计算分析:依据小概率值的独立性检验,在这两个车站中,能否认为旅客满意程度与车站编号有关联?
(2)根据以往调图经验,列车在编号为8至14的终到站每次调图时有的概率改为当前终到站的西侧一站,有的概率改为当前终到站的东侧一站,每次调图之间相互独立.已知原定终到站编号为11的列车经历了3次调图,第3次调图后的终到站编号记为,求的分布列及均值.
附,其中.
0.1 0.01 0.001
2.706 6.635 10.828
【解】(1))补充列联表如下:
车站编号 满意 不满意 合计
10 35 15 50
11 20 30 50
合计 55 45 100
零假设为:旅客满意程度与车站编号无关,则,
所以根据小概率值的独立性检验,推断不成立,
即认为旅客满意程度与车站编号有关联.
(2)由题的可能取值为8,10,12,14,
则;;
;,
所以的分布列为
8 10 12 14
所以.
4.(2025·甘肃白银·二模)从全校学生中随机选取100人,统计了他们在寒假期间,一周参加体育锻炼的时间(单位:小时),分别位于区间,,,,,,用频率分布直方图表示如图,假设用频率估计概率,且每个学生参加课后活动的时间相互独立.
(1)求a的值,并估计全校学生在寒假期间一周参加体育锻炼的时间位于区间的概率;
(2)完成列联表,并依据小概率值的独立性检验,能否认为性别与学生在寒假期间一周参加体育锻炼的时间有关联?
(3)以频率作为概率,从全校学生中随机选取3人,记X表示这3人寒假期间一周参加体育锻炼的时间在区间的人数,求X的分布列和数学期望.
锻炼时间 合计
男生 30
女生 25
合计 100
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【解】(1)由题意可得,
所以估计全校学生在寒假期间一周参加体育锻炼的时间位于区间的概率为.
(2)位于区间的概率为,故该区间范围的学生有,
位于区间的概率为,故该区间范围的学生有,
故列联表如下:
锻炼时间 合计
男生 30 30 60
女生 25 15 40
合计 55 45 100
零假设性别与学生在寒假期间一周参加体育锻炼的时间无关联,
则由表格数据可得,
所以依据小概率值的独立性检验,没有充分依据推断不成立,即我们推断成立,
所以认为性别与学生在寒假期间一周参加体育锻炼的时间无关联.
(3)由题寒假期间一周参加体育锻炼的时间在区间的概率为,
则,且,
所以,,
所以的分布列为:
P 0 1 2 3
X
所以.
5.(2026·陕西商洛·二模)汉中藤编久负盛名,被列入国家非物质文化遗产.一根藤,牵起千年的记忆,也编织出乡村振兴的新图景.汉中某藤编制作工坊积极探索线上推广渠道,藤编产品销量逐年增长.该工坊为了科学规划生产,统计了2021-2025年藤编产品的销量数据如下表:
年份年 2021 2022 2023 2024 2025
年份代码 1 2 3 4 5
销量/万件 6 7 10 12 15
(1)统计表明销量与年份代码有较强的线性相关关系,求关于的线性回归方程,并预测该工坊2026年藤编产品的销量;
(2)已知该工坊2025年售出的藤编产品中,有9万件通过线上售出,用频率估计概率,现从2025年售出的藤编产品中随机抽取4件,求其中线上售出数量的分布列及数学期望.
附:为回归直线方程,其中.
【解】(1)


所以,

所以关于的线性回归方程为;
当2026年时,即时,,
所以预测该工坊2026年的藤编产品的销量约为16.9万件.
(2)该工坊2025年售出的藤编产品中,有9万件通过线上售出,用频率估计概率,
所以2025年售出的藤编产品中,通过线上售出的概率为,
由题意可知:,
所以,
,,

所以其中线上售出数量的分布列为:
0 1 2 3 4
数学期望.
6.(2026·重庆·一模)某地区从高一年级的物理测试中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图.
(1)该地区某学校建议此次物理测试成绩在本地区前的学生选科报物理方向,试估计报物理方向的学生本次成绩不低于多少分?(结果保留整数)
(2)从成绩位于区间和的答卷中,采用分层抽样随机抽取7份,再从这7份中随机抽取3份,设成绩在的答卷份数为随机变量,求的分布列及数学期望.
【解】(1)由题意,解得,
成绩在的频率为0.1,在的频率为0.25,在的频率为0.3,
因为,
所以选报物理方向的最低分在内,则,
解得,所以估计报物理方向的学生本次成绩不低于72分.
(2)由题可知,成绩在区间的频数为,
成绩在区间的频数为,
利用分层抽样,从中抽取7份,成绩在的频数为,
成绩在的频数为,
再从这7份答卷中随机抽取3份,的所有可能取值为,

故的分布列为:
0 1 2
所以的数学期望为:.
7.(2026·河北承德·一模)2025年9月3日在天安门广场举行纪念中国人民抗日战争暨世界反法西斯战争胜利80周年阅兵式,这不仅是一场军事盛宴,更是一次民族精神的洗礼.某中学为了增强学生的爱国主义情怀,减轻学习压力,决定组织一次军事知识竞赛.为了了解学生喜欢军事是否与性别有关,随机抽取了100名学生进行调查,已知女生中有15名喜欢军事,男生中有的人喜欢军事,喜欢军事的学生中有是男生.参加竞赛的学生从喜欢军事的学生中选取,测试题型分为选择题与填空题两种,每次由电脑随机选出一道,选择题与填空题出现的频率之比为,已知学生答对选择题的概率为,答对填空题的概率为,每次答题互不影响.
喜欢军事 不喜欢军事 合计
男生
女生 15
合计
(1)根据已知条件补充完整上表,并根据小概率值的独立性检验,分析该校学生喜欢军事是否与性别有关;
(2)若每位学生答3题,求该学生答对题数X的分布列和数学期望.
附:,其中.
【解】(1)由题可知喜欢军事的男生与女生人数之比为,
且有15名女生喜欢军事,所以有30名男生喜欢军事,
因为男生中有的人喜欢军事,所以男生共有50名,故不喜欢军事的男生有20名,
完善后的列联表如下:
喜欢军事 不喜欢军事 合计
男生 30 20 50
女生 15 35 50
合计 45 55 100
零假设为:该校学生喜欢军事与性别无关.

根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即该校学生喜欢军事与性别无关.
(2)学生答对任意一题的概率为,
的可能取值为0,1,2,3,且,
,,
,,
所以的分布列为
0 1 2 3
数学期望.
8.(2026·江苏镇江·一模)AI幻觉,是指AI模型生成看似合理但实际不正确或毫无事实依据的信息的现象,AI幻觉率是指AI模型产生AI幻觉的概率.现抽取了某公司研发的14个使用率较高的AI模型,其幻觉率如下表所示:
AI模型 1 2 3 4 5 6 7 8 9 10 11 12 13 14
幻觉率 1.3% 1.8% 2.9% 1.5% 1.9% 2.9% 0.7% 0.9% 1.6% 2.4% 0.8% 1.6% 2.4% 2.8%
(1)从表中提供的AI模型中任取一个,求该模型幻觉率小于2%的概率;
(2)从表中提供的幻觉率小于的AI模型中任取3个,用随机变量表示其中幻觉率小于的模型个数,求随机变量的分布列和数学期望.
【解】(1)14个AI模型,幻觉率高于2%的有2.9%,2.9%,2.4%,2.4%,2.8%,共有5个,
所以幻觉率低于的概率为.
(2)幻觉率低于2%的AI模型中共9个,其中低于1.3%的模型有3个,故
, ,
, ,
故分布列为
0 1 2 3
故.
9.(2026·湖南邵阳·二模)为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法从甲、乙两所学校共抽取120名学生.通过测验得到如下数据:甲校50名学生中有10名学生的数学成绩优秀;乙校70名学生中有10名学生的数学成绩优秀.根据抽样数据的分析,得到不完整抽样数据列联表,如表(一)所示.
单位:人
学校 数学成绩 合计
不优秀 优秀
甲校 10 50
乙校 10 70
合计
表(一)
(1)完成表(一)列联表,依据小概率值的独立性检验,能否据此推断两校学生的数学成绩优秀率有差异?
(2)已知甲、乙两所学校利用AI自习室帮助数学不优秀的学生进行成绩有效转化,且转化数据如下:甲校数学不优秀学生成绩有效转化的概率为,乙校数学不优秀学生成绩有效转化的概率为.若从甲、乙两所学校数学不优秀的学生中采用随机抽样的方式抽出1名学生,用样本估计总体,用频率估计概率,求该学生数学成绩有效转化的概率.
参考公式与数据:
,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【解】(1)列联表如下:
单位:人
学校 数学成绩 合计
不优秀 优秀
甲校 40 10 50
乙校 60 10 70
合计 100 20 120
零假设为:两校学生的数学成绩优秀率无差异.
根据列联表数据,计算得到
.
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为两校学生的数学成绩优秀率没有差异.
(2)设事件“利用AI自习室帮助该学生且数学成绩能有效转化”,
事件“该学生来自甲校”,事件“该学生来自乙校”,则
,,且,,
则,
所以该学生数学成绩有效转化的概率为.
10.(2026·贵州毕节·二模)某电商公司为研究直播带货中平台流量推广投入x(单位:万元)与销售额y(单位:万元)的关系,统计了最近10场直播带货中平台流量推广投入和销售额数据,计算得:,.
(1)求销售额y关于直播带货中平台流量推广投入x的线性回归方程;
(2)该公司计划下一场直播投入总额10万元,现有两种方案:方案一:全部用于平台流量推广;方案二:部分用于平台流量推广,部分用于主播佣金激励.其中平台流量推广投入x万元(),主播佣金激励投入()万元.根据以往经验,主播佣金激励投入t万元的销售额为()万元;平台流量推广的效果仍符合(1)中的回归方程.比较两种方案,如何分配投入才能使销售额最大?并求出最大销售额.
参考公式:线性回归方程中,,.
【解】(1)由题意知,样本量 , ,,
根据公式变形得回归系数: ,
则 ,
因此,销售额y关于直播带货中平台流量推广投入x的线性回归方程为:;
(2)方案一:全部投入平台流量推广,即代入回归方程得销售额:万元;
方案二:投入万元到流量推广,万元到主播佣金,且,
总销售额为流量销售额加佣金销售额:,
对称轴为 ,在定义域内,最大值为 万元,
因为 ,所以投入6万元到平台流量推广,4万元到主播佣金时销售额最大,最大销售额为76万元。
综上可得:分配6万元投入平台流量推广、4万元投入主播佣金时销售额最大,最大销售额为万元.
21世纪教育网(www.21cnjy.com)
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源列表