资源简介 专题08 概率统计及数字特征解答题综合(五大考点,61题)考点 十年考情 (2016-2025) 命题趋势考点 1:独立性检验为载体及其应用 2025 全国一卷:研究疾病与超声波检查结果关系的独立性检验;2024 全国甲卷:甲、乙车间产品优级品率差异的独立性检验;2024 上海卷:体育锻炼时长与学业成绩关系的独立性检验;2023 全国甲卷:臭氧效应下小白鼠体重增加量差异的独立性检验;2022 新高考全国 Ⅰ 卷:疾病与卫生习惯关系的独立性检验;2022 全国甲卷:长途客车准点与所属公司关系的独立性检验;2021 全国甲卷:甲、乙机床产品质量差异的独立性检验;2020 全国 III 卷:空气质量与锻炼人次关系的独立性检验;2020 山东卷:空气质量中 SO 和 PM2.5 浓度关系的独立性检验;2019 全国 I 卷:男、女顾客对商场服务评价差异的独立性检验;2018 全国 III 卷:两种生产方式效率差异的独立性检验;2017 全国 II 卷:新、旧网箱养殖产量差异的独立性检验。 独立性检验在高考中考查频率较高,主要围绕实际问题,如疾病与检查结果、产品质量、生产效率等,通过列联表计算卡方值,与临界值比较来判断变量间是否有关联,是考查的热点。考点 2:线性回归相关系数的计算 2022 全国乙卷:树木根部横截面积与材积量的样本相关系数计算及总材积量估计;2020 全国 II 卷:野生动物数量与植物覆盖面积的相关系数计算;2017 全国 I 卷:零件尺寸的相关系数计算及生产过程判断;2016 全国 III 卷:生活垃圾无害化处理量与年份的线性回归分析及相关系数说明。 线性回归相关系数的考查主要涉及实际数据,如树木材积量、野生动物数量等,通过公式计算相关系数,判断变量间线性相关程度,进而进行预测,是重点考查内容。考点 3:赛事类的分布列及期望方差 2025 上海卷:奥运会男子混合泳接力成绩的极差、中位数计算及成绩预测;2024 新课标 Ⅱ 卷:投篮比赛中比赛成绩的概率及期望计算;2023 新课标 Ⅰ 卷:投篮规则下投篮人概率及投篮次数期望计算;2022 全国甲卷:学校体育比赛中获冠军概率及乙校得分分布列与期望;2022 北京卷:铅球比赛中获优秀奖概率、总人数期望及冠军得主判断;2021 新高考全国 Ⅰ 卷:知识竞赛中累计得分分布列及期望;2020 全国 I 卷:羽毛球比赛中连胜概率、比赛场数概率及丙获胜概率;2019 全国 II 卷:乒乓球比赛中比赛结束球数概率计算;2016 山东卷:猜成语活动中得分分布列及期望。 赛事类问题在高考中常见,以投篮、比赛等为背景,考查分布列的构建,计算各得分情况的概率,进而求出数学期望,是考查的重要方向。考点 4:二项分布及其应用 2025 全国二卷:乒乓球练习中得分概率及相关证明;2025 北京卷:考试答题中选择正确概率、得分期望及掌握知识点概率比较;2023 北京卷:农产品价格变化概率及价格情况概率计算;2022 新高考全国 Ⅱ 卷:疾病患者年龄概率及特定年龄患病概率计算;2018 全国 I 卷:产品检验中不合格品概率及检验决策;2019 天津卷:上学到校情况的二项分布及期望;2020 北京卷:活动支持情况的概率计算;2018 北京卷:电影好评概率及相关判断;2016 全国 II 卷:保险保费概率及平均保费计算。 二项分布在高考中多结合实际场景,如产品检验、考试答题、保险等,考查概率计算及期望,是重点考查内容之一。考点 5:概率统计的实际应用 2024 北京卷:保险产品索赔情况中索赔概率及毛利润期望计算;2023 新课标 Ⅱ 卷:疾病指标临界值确定及相关函数最小值计算;2023 全国乙卷:工艺处理橡胶产品伸缩率差异的检验;2021 全国乙卷:新旧设备产品指标均值差异检验;2019 全国 III 卷:离子残留程度的平均值计算;2020 全国 I 卷:加工产品等级概率及平均利润;2020 江苏卷:口袋取球的概率及期望;2019 北京卷:支付方式使用概率及相关判断;2018 全国 II 卷:环境基础设施投资额预测;2019 全国 II 卷:企业产值增长率的比例及平均数与标准差估计。 概率统计的实际应用在高考中广泛涉及保险、医疗、工业生产、经济等领域,通过数据处理、概率计算、统计分析解决实际问题,是考查的热点趋势。考点01:独立性检验为载体及其应用1.(2025·全国一卷·高考真题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:超声波检查结果组别 正常 不正常 合计患该疾病 20 180 200未患该疾病 780 20 800合计 800 200 1000(1)记超声波检查结果不正常者患该疾病的概率为P,求P的估计值;(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.附,0.050 0.010 0.0013.841 6.635 10.8282.(2024·全国甲卷·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品 合格品 不合格品 总计甲车间 26 24 0 50乙车间 70 28 2 100总计 96 52 2 150(1)填写如下列联表:优级品 非优级品甲车间乙车间能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()附:0.050 0.010 0.001k 3.841 6.635 10.828优级品 非优级品甲车间 26 24乙车间 70 303.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:时间范围学业成绩优秀 5 44 42 3 1不优秀 134 147 137 40 27(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?(附:其中,.)其他 合计优秀 45 50 95不优秀 177 308 485合计 222 358 5804.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;(2)实验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2实验组的小白鼠体重的增加量从小到大排序为:7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:对照组实验组(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.附:0.100 0.050 0.0102.706 3.841 6.635合计对照组 6 14 20实验组 14 6 20合计 20 20 405.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表对照组试验组(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.100 0.050 0.0102.706 3.841 6.635合计对照组 6 14 20试验组 14 6 20合计 20 20 406.(2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好 良好病例组 40 60对照组 10 90(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:;(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.附,0.050 0.010 0.001k 3.841 6.635 10.8287.(2022·全国甲卷·高考真题)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数 未准点班次数A 240 20B 210 30(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:,0.100 0.050 0.0102.706 3.841 6.635准点班次数 未准点班次数 合计A 240 20 260B 210 30 240合计 450 50 5008.(2021·全国甲卷·高考真题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计甲机床 150 50 200乙机床 120 80 200合计 270 130 400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少 (2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异 附:0.050 0.010 0.001k 3.841 6.635 10.8289.(2020·全国III卷·高考真题)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级 [0,200] (200,400] (400,600]1(优) 2 16 252(良) 5 10 123(轻度污染) 6 7 84(中度污染) 7 2 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400 人次>400空气质量好空气质量不好附:,P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828人次 人次空气质量好空气质量不好10.(2020·山东·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;(2)根据所给数据,完成下面的列联表:(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:,合计64 16 8010 10 20合计 74 26 10011.(2020·海南·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表: 32 18 46 8 123 7 10(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;(2)根据所给数据,完成下面的列联表: (3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:,0.050 0.010 0.0013.841 6.635 10.828合计64 16 8010 10 20合计 74 26 10012.(2019·全国I卷·高考真题)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意男顾客 40 10女顾客 30 20(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:.P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.82813.(2018·全国III卷·高考真题)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:超过 不超过第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:,超过 不超过第一种生产方式 15 5第二种生产方式 5 1514.(2017·全国II卷·高考真题)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg 箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较.附:P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828箱产量<50kg 箱产量≥50kg旧养殖法 62 38新养殖法 34 6615.(2017·全国II卷·高考真题)(2017新课标全国II理科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下: (1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg 箱产量≥50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,箱产量 箱产量 合计旧养殖法 62 38 100新养殖法 34 66 100合计 96 104 200考点02:线性回归相关系数的计算16.(2022·全国乙卷·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i 1 2 3 4 5 6 7 8 9 10 总和根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.17.(2020·全国II卷·高考真题)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.18.(2017·全国I卷·高考真题)为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序 1 2 3 4 5 6 7 8零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04抽取次序 9 10 11 12 13 14 15 16零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得,,,其中为抽取的第个零件的尺寸,.(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)附:样本的相关系数,.19.(2016·全国III卷·高考真题)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. (Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:,,,≈2.646.参考公式:相关系数回归方程中斜率和截距的最小二乘估计公式分别为:考点03:赛事类的分布列及期望方差20.(2025·上海·高考真题)2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.206.78 207.46 207.95 209.34 209.35210.68 213.73 214.84 216.93 216.93(1)求这组数据的极差与中位数;(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒).21.(2024·新课标Ⅱ卷·高考真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.(2)假设,(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?22.(2023·新课标Ⅰ卷·高考真题)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.(1)求第2次投篮的人是乙的概率;(2)求第次投篮的人是甲的概率;(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.23.(2022·全国甲卷·高考真题)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.(1)求甲学校获得冠军的概率;(2)用X表示乙学校的总得分,求X的分布列与期望.0 10 20 300.16 0.44 0.34 0.0624.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)X 0 1 2 3P25.(2021·新高考全国Ⅰ卷·高考真题)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.26.(2020·全国I卷·高考真题)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.27.(2019·全国II卷·高考真题)11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.28.(2016·山东·高考真题)甲、乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语,在一轮活动中,如果两人都猜对,则“星队”得3分;如果只有一个人猜对,则“星队”得1分;如果两人都没猜对,则“星队”得0分.已知甲每轮猜对的概率是,乙每轮猜对的概率是;每轮活动中甲、乙猜对与否互不影响.各轮结果亦互不影响.假设“星队”参加两轮活动,求:(Ⅰ)“星队”至少猜对3个成语的概率;(Ⅱ)“星队”两轮得分之和为X的分布列和数学期望EX.0 1 2 3 4 6P考点04:二项分布及其应用29.(2025·全国二卷·高考真题)甲、乙两人进行乒乓球练习,每个球胜者得1分,负者得0分.设每个球甲胜的概率为,乙胜的概率为q,,且各球的胜负相互独立,对正整数,记为打完k个球后甲比乙至少多得2分的概率,为打完k个球后乙比甲至少多得2分的概率.(1)求(用p表示).(2)若,求p.(3)证明:对任意正整数m,.30.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.(1)估计甲校高一年级学生该题选择正确的概率(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).31.(2023·北京·高考真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.时段 价格变化第1天到第20天 - + + 0 - - - + + 0 + 0 - - + - + 0 0 +第21天到第40天 0 + + 0 - - - + + 0 + 0 + - - - + 0 - +用频率估计概率.(1)试估计该农产品价格“上涨”的概率;(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)32.(2023·上海·高考真题)21世纪汽车博览会在上海2023年6月7日在上海举行,下表为某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示:红色外观 蓝色外观米色内饰 8 12棕色内饰 2 3(1)若小明从这些模型中随机拿一个模型,记事件A为小明取到的模型为红色外观,事件B取到模型有棕色内饰,求,并据此判断事件A和事件B是否独立;(2)为回馈客户,该公司举行了一个抽奖活动,并规定,在一次抽奖中,每人可以一次性抽取两个汽车模型。为了得到奖品类型,现作出如下假设:假设1:每人抽取的两个模型会出现三种结果:①两个模型的外观和内饰均为同色;②两个模型的外观和内饰均为不同色;③两个模型的外观同色但内饰不同色,或内饰同色但外观不同色。假设2:该抽奖设置三类奖,奖金金额分别为:一等奖600元,二等奖300元,三等奖150元。假设3:每种抽取的结果都对应一类奖。出现某种结果的概率越小,奖金金额越高。请判断以上三种结果分别对应几等奖。设中奖的奖金数是,写出的分布,并求的数学期望。600 300 15033.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图: (1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间的概率;(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).34.(2018·全国I卷·高考真题)某工厂的某种产品成箱包装,每箱件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.(1)记件产品中恰有件不合格品的概率为,求的最大值点;(2)现对一箱产品检验了件,结果恰有件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为元,若有不合格品进入用户手中,则工厂要对每件不合格品支付元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?35.(2019·天津·高考真题)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(Ⅰ)用表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量的分布列和数学期望;(Ⅱ)设为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件发生的概率.0 1 2 336.(2020·北京·高考真题)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:男生 女生支持 不支持 支持 不支持方案一 200人 400人 300人 100人方案二 350人 250人 150人 250人假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案二的概率估计值记为,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为,试比较与 的大小.(结论不要求证明)37.(2018·北京·高考真题)电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型 第一类 第二类 第三类 第四类 第五类 第六类电影部数 140 50 300 200 800 510好评率 0.4 0.2 0.15 0.25 0.2 0.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“”表示第k类电影得到人们喜欢,“”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差,,,,,的大小关系.38.(2016·全国II卷·高考真题)某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数 0 1 2 3 4保费设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数 0 1 2 3 4概率 0.30 0.15 0.20 0.20 0.10 0.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出的概率;(Ⅲ)求续保人本年度的平均保费与基本保费的比值.39.(2016·北京·高考真题)A,B,C三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时):A班 6 6.5 7 7.5 8B班 6 7 8 9 10 11 12C班 3 4.5 6 7.5 9 10.5 12 13.8(Ⅰ)试估计C班的学生人数;(Ⅱ)从A班和C班抽出的学生中,各随机选取一人,A班选出的人记为甲,C班选出的人记为乙.假设所有学生的锻炼时间相互独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;(Ⅲ)再从A,B,C三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时).这3个新数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为,试判断和的大小.(结论不要求证明)考点05:概率统计的实际应用40.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:赔偿次数 0 1 2 3 4单数假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.(1)估计一份保单索赔次数不少于2的概率;(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.(i)记为一份保单的毛利润,估计的数学期望;(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)41.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率%时,求临界值c和误诊率;(2)设函数,当时,求的解析式,并求在区间的最小值.42.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:试验序号 1 2 3 4 5 6 7 8 9 10伸缩率 545 533 551 522 575 544 541 568 596 548伸缩率 536 527 543 530 560 533 522 550 576 536记,记的样本平均数为,样本方差为.(1)求,;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)43.(2021·全国乙卷·高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).44.(2019·全国III卷·高考真题)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).45.(2020·全国I卷·高考真题)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数 40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数 28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务 46.(2020·江苏·高考真题)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为Xn,恰有2个黑球的概率为pn,恰有1个黑球的概率为qn.(1)求p1,q1和p2,q2;(2)求2pn+qn与2pn-1+qn-1的递推关系式和Xn的数学期望E(Xn)(用 n表示) .0 1 247.(2019·北京·高考真题)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下: 交付金额(元) 支付方式 (0,1000] (1000,2000] 大于2000仅使用A 18人 9人 3人仅使用B 10人 14人 1人(Ⅰ)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.X 0 1 248.(2019·北京·高考真题)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(Ⅰ)估计该校学生中上个月A,B两种支付方式都使用的人数;(Ⅱ)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元.结合(Ⅱ)的结果,能否认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由.49.(2018·全国II卷·高考真题)下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.50.(2019·全国II卷·高考真题)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.的分组企业数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:.51.(2018·全国I卷·高考真题)某家庭记录了未使用节水龙头天的日用水量数据(单位:)和使用了节水龙头天的日用水量数据,得到频数分布表如下:未使用节水龙头天的日用水量频数分布表日用水量频数使用了节水龙头天的日用水量频数分布表日用水量频数(1)作出使用了节水龙头天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按天计算,同一组中的数据以这组数据所在区间中点的值作代表.)52.(2018·天津·高考真题)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I)应从甲、乙、丙三个部门的员工中分别抽取多少人?(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.X 0 1 2 3P53.(2017·全国III卷·高考真题)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40)天数 2 16 36 25 7 4以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.54.(2018·天津·高考真题)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.55.(2019·天津·高考真题)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有人,现采用分层抽样的方法,从该单位上述员工中抽取人调查专项附加扣除的享受情况.(Ⅰ)应从老、中、青员工中分别抽取多少人?(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为.享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工 项目 A B C D E F子女教育 ○ ○ × ○ × ○继续教育 × × ○ × ○ ○大病医疗 × × × ○ × ×住房贷款利息 ○ ○ × × ○ ○住房租金 × × ○ × × ×赡养老人 ○ ○ × × × ○(i)试用所给字母列举出所有可能的抽取结果;(ii)设为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件发生的概率.56.(2016·全国II卷·高考真题)某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数 0 1 2 3 4保费随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:出险次数 0 1 2 3 4频数 60 50 30 30 20 10(I)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;(Ⅲ)求续保人本年度的平均保费估计值.57.(2018·北京·高考真题)电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型 第一类 第二类 第三类 第四类 第五类 第六类电影部数好评率好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加,哪类电影的好评率减少,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)58.(2019·江苏·高考真题)在平面直角坐标系xOy中,设点集,令.从集合Mn中任取两个不同的点,用随机变量X表示它们之间的距离.(1)当n=1时,求X的概率分布;(2)对给定的正整数n(n≥3),求概率P(X≤n)(用n表示).59.(2017·江苏·高考真题)已知一个口袋有m个白球,n个黑球(m,n ,n 2),这些球除颜色外全部相同.现将口袋中的球随机的逐个取出,并放入如图所示的编号为1,2,3,……,m+n的抽屉内,其中第k次取球放入编号为k的抽屉(k=1,2,3,……,m+n).(1)试求编号为2的抽屉内放的是黑球的概率p;(2)随机变量x表示最后一个取出的黑球所在抽屉编号的倒数,E(x)是x的数学期望,证明X … …P … …60.(2017·北京·高考真题)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者. (Ⅰ)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;(Ⅱ)从图中A,B,C,D四人中随机选出两人,记为选出的两人中指标x的值大于1.7的人数,求的分布列和数学期望E();(Ⅲ)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小.(只需写出结论)0 1 261.(2017·山东·高考真题)某旅游爱好者计划从3个亚洲国家A1,A2,A3和3个欧洲国家B1,B2,B3中选择2个国家去旅游.(1)若从这6个国家中任选2个,求这2个国家都是亚洲国家的概率;(2)若从亚洲国家和欧洲国家中各选1个,求这两个国家包括A1,但不包括B1的概率.21世纪教育网(www.21cnjy.com)21世纪教育网(www.21cnjy.com)专题08 概率统计及数字特征解答题综合(五大考点,61题)考点 十年考情 (2016-2025) 命题趋势考点 1:独立性检验为载体及其应用 2025 全国一卷:研究疾病与超声波检查结果关系的独立性检验;2024 全国甲卷:甲、乙车间产品优级品率差异的独立性检验;2024 上海卷:体育锻炼时长与学业成绩关系的独立性检验;2023 全国甲卷:臭氧效应下小白鼠体重增加量差异的独立性检验;2022 新高考全国 Ⅰ 卷:疾病与卫生习惯关系的独立性检验;2022 全国甲卷:长途客车准点与所属公司关系的独立性检验;2021 全国甲卷:甲、乙机床产品质量差异的独立性检验;2020 全国 III 卷:空气质量与锻炼人次关系的独立性检验;2020 山东卷:空气质量中 SO 和 PM2.5 浓度关系的独立性检验;2019 全国 I 卷:男、女顾客对商场服务评价差异的独立性检验;2018 全国 III 卷:两种生产方式效率差异的独立性检验;2017 全国 II 卷:新、旧网箱养殖产量差异的独立性检验。 独立性检验在高考中考查频率较高,主要围绕实际问题,如疾病与检查结果、产品质量、生产效率等,通过列联表计算卡方值,与临界值比较来判断变量间是否有关联,是考查的热点。考点 2:线性回归相关系数的计算 2022 全国乙卷:树木根部横截面积与材积量的样本相关系数计算及总材积量估计;2020 全国 II 卷:野生动物数量与植物覆盖面积的相关系数计算;2017 全国 I 卷:零件尺寸的相关系数计算及生产过程判断;2016 全国 III 卷:生活垃圾无害化处理量与年份的线性回归分析及相关系数说明。 线性回归相关系数的考查主要涉及实际数据,如树木材积量、野生动物数量等,通过公式计算相关系数,判断变量间线性相关程度,进而进行预测,是重点考查内容。考点 3:赛事类的分布列及期望方差 2025 上海卷:奥运会男子混合泳接力成绩的极差、中位数计算及成绩预测;2024 新课标 Ⅱ 卷:投篮比赛中比赛成绩的概率及期望计算;2023 新课标 Ⅰ 卷:投篮规则下投篮人概率及投篮次数期望计算;2022 全国甲卷:学校体育比赛中获冠军概率及乙校得分分布列与期望;2022 北京卷:铅球比赛中获优秀奖概率、总人数期望及冠军得主判断;2021 新高考全国 Ⅰ 卷:知识竞赛中累计得分分布列及期望;2020 全国 I 卷:羽毛球比赛中连胜概率、比赛场数概率及丙获胜概率;2019 全国 II 卷:乒乓球比赛中比赛结束球数概率计算;2016 山东卷:猜成语活动中得分分布列及期望。 赛事类问题在高考中常见,以投篮、比赛等为背景,考查分布列的构建,计算各得分情况的概率,进而求出数学期望,是考查的重要方向。考点 4:二项分布及其应用 2025 全国二卷:乒乓球练习中得分概率及相关证明;2025 北京卷:考试答题中选择正确概率、得分期望及掌握知识点概率比较;2023 北京卷:农产品价格变化概率及价格情况概率计算;2022 新高考全国 Ⅱ 卷:疾病患者年龄概率及特定年龄患病概率计算;2018 全国 I 卷:产品检验中不合格品概率及检验决策;2019 天津卷:上学到校情况的二项分布及期望;2020 北京卷:活动支持情况的概率计算;2018 北京卷:电影好评概率及相关判断;2016 全国 II 卷:保险保费概率及平均保费计算。 二项分布在高考中多结合实际场景,如产品检验、考试答题、保险等,考查概率计算及期望,是重点考查内容之一。考点 5:概率统计的实际应用 2024 北京卷:保险产品索赔情况中索赔概率及毛利润期望计算;2023 新课标 Ⅱ 卷:疾病指标临界值确定及相关函数最小值计算;2023 全国乙卷:工艺处理橡胶产品伸缩率差异的检验;2021 全国乙卷:新旧设备产品指标均值差异检验;2019 全国 III 卷:离子残留程度的平均值计算;2020 全国 I 卷:加工产品等级概率及平均利润;2020 江苏卷:口袋取球的概率及期望;2019 北京卷:支付方式使用概率及相关判断;2018 全国 II 卷:环境基础设施投资额预测;2019 全国 II 卷:企业产值增长率的比例及平均数与标准差估计。 概率统计的实际应用在高考中广泛涉及保险、医疗、工业生产、经济等领域,通过数据处理、概率计算、统计分析解决实际问题,是考查的热点趋势。考点01:独立性检验为载体及其应用1.(2025·全国一卷·高考真题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:超声波检查结果组别 正常 不正常 合计患该疾病 20 180 200未患该疾病 780 20 800合计 800 200 1000(1)记超声波检查结果不正常者患该疾病的概率为P,求P的估计值;(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.附,0.050 0.010 0.0013.841 6.635 10.828【答案】(1)(2)有关【分析】(1)根据古典概型的概率公式即可求出;(2)根据独立性检验的基本思想,求出,然后与小概率值对应的临界值比较,即可判断.【详解】(1)根据表格可知,检查结果不正常的人中有人患病,所以的估计值为;(2)零假设为:超声波检查结果与患病无关,根据表中数据可得,,根据小概率值的独立性检验,我们推断不成立,即认为超声波检查结果与患该病有关,该推断犯错误的概率不超过.2.(2024·全国甲卷·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品 合格品 不合格品 总计甲车间 26 24 0 50乙车间 70 28 2 100总计 96 52 2 150(1)填写如下列联表:优级品 非优级品甲车间乙车间能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()附:0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)答案见详解(2)答案见详解【分析】(1)根据题中数据完善列联表,计算,并与临界值对比分析;(2)用频率估计概率可得,根据题意计算,结合题意分析判断.【详解】(1)根据题意可得列联表:优级品 非优级品甲车间 26 24乙车间 70 30可得,因为,所以有的把握认为甲、乙两车间产品的优级品率存在差异,没有的把握认为甲,乙两车间产品的优级品率存在差异.(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为,用频率估计概率可得,又因为升级改造前该工厂产品的优级品率,则,可知,所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.3.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:时间范围学业成绩优秀 5 44 42 3 1不优秀 134 147 137 40 27(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?(附:其中,.)【答案】(1)(2)(3)有【分析】(1)求出相关占比,乘以总人数即可;(2)根据平均数的计算公式即可得到答案;(3)作出列联表,再提出零假设,计算卡方值和临界值比较大小即可得到结论.【详解】(1)由表可知锻炼时长不少于1小时的人数为占比,则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为.(2)估计该地区初中生的日均体育锻炼时长约为.则估计该地区初中学生日均体育锻炼的时长为0.9小时.(3)由题列联表如下:其他 合计优秀 45 50 95不优秀 177 308 485合计 222 358 580提出零假设:该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关.其中..则零假设不成立,即有的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关.4.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;(2)实验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2实验组的小白鼠体重的增加量从小到大排序为:7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:对照组实验组(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.附:0.100 0.050 0.0102.706 3.841 6.635【答案】(1)分布列见解析,(2)(i);列联表见解析,(ii)能【分析】(1)利用超几何分布的知识即可求得分布列及数学期望;(2)(i)根据中位数的定义即可求得,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)依题意,的可能取值为,则,,,所以的分布列为:故.(2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,观察数据可得第20位为,第21位数据为,所以,故列联表为:合计对照组 6 14 20实验组 14 6 20合计 20 20 40(ii)由(i)可得,,所以能有的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.5.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表对照组试验组(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.100 0.050 0.0102.706 3.841 6.635【答案】(1)(2)(i);列联表见解析,(ii)能【分析】(1)直接根据均值定义求解;(2)(i)根据中位数的定义即可求得,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)试验组样本平均数为:(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为,后续依次为,故第20位为,第21位数据为,所以,故列联表为:合计对照组 6 14 20试验组 14 6 20合计 20 20 40(ii)由(i)可得,,所以能有的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.6.(2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好 良好病例组 40 60对照组 10 90(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:;(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.附,0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)答案见解析(2)(i)证明见解析;(ii);【分析】(1)由所给数据结合公式求出的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求.【详解】(1)由已知,又,,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为,所以所以,(ii)由已知,,又,,所以7.(2022·全国甲卷·高考真题)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数 未准点班次数A 240 20B 210 30(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:,0.100 0.050 0.0102.706 3.841 6.635【答案】(1)A,B两家公司长途客车准点的概率分别为,(2)有【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算,再利用临界值表比较即可得结论.【详解】(1)根据表中数据,A共有班次260次,准点班次有240次,设A家公司长途客车准点事件为M,则;B共有班次240次,准点班次有210次,设B家公司长途客车准点事件为N,则.A家公司长途客车准点的概率为;B家公司长途客车准点的概率为.(2)列联表准点班次数 未准点班次数 合计A 240 20 260B 210 30 240合计 450 50 500=,根据临界值表可知,有的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.8.(2021·全国甲卷·高考真题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计甲机床 150 50 200乙机床 120 80 200合计 270 130 400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少 (2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异 附:0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)75%;60%;(2)能.【分析】根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为,乙机床生产的产品中的一级品的频率为.(2),故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.9.(2020·全国III卷·高考真题)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级 [0,200] (200,400] (400,600]1(优) 2 16 252(良) 5 10 123(轻度污染) 6 7 84(中度污染) 7 2 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400 人次>400空气质量好空气质量不好附:,P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为、、、的概率;(2)利用每组的中点值乘以频数,相加后除以可得结果;(3)根据表格中的数据完善列联表,计算出的观测值,再结合临界值表可得结论.【详解】(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为(3)列联表如下:人次 人次空气质量好空气质量不好,因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.10.(2020·山东·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;(2)根据所给数据,完成下面的列联表:(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:,【答案】(1);(2)答案见解析;(3)有.【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得列联表;(3)计算出,结合临界值表可得结论.【详解】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;(2)由所给数据,可得列联表为:合计64 16 8010 10 20合计 74 26 100(3)根据列联表中的数据可得,因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.【点睛】本题考查了古典概型的概率公式,考查了完善列联表,考查了独立性检验,属于中档题.11.(2020·海南·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表: 32 18 46 8 123 7 10(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;(2)根据所给数据,完成下面的列联表: (3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:,0.050 0.010 0.0013.841 6.635 10.828【答案】(1);(2)答案见解析;(3)有.【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得列联表;(3)计算出,结合临界值表可得结论.【详解】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;(2)由所给数据,可得列联表为:合计64 16 8010 10 20合计 74 26 100(3)根据列联表中的数据可得,因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.【点睛】本题考查了古典概型的概率公式,考查了完善列联表,考查了独立性检验,属于中档题.12.(2019·全国I卷·高考真题)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意男顾客 40 10女顾客 30 20(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:.P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1);(2)能有的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有的把握认为男、女顾客对该商场服务的评价有差异.【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为,50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为,(2)由列联表可知,所以能有的把握认为男、女顾客对该商场服务的评价有差异.【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算的值,独立性检验,属于简单题目.13.(2018·全国III卷·高考真题)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:超过 不超过第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:,【答案】(1)第二种生产方式的效率更高. 理由见解析(2)80(3)能【详解】分析:(1)计算两种生产方式的平均时间即可.(2)计算出中位数,再由茎叶图数据完成列联表.(3)由公式计算出,再与6.635比较可得结果.详解:(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知.列联表如下:超过 不超过第一种生产方式 15 5第二种生产方式 5 15(3)由于,所以有99%的把握认为两种生产方式的效率有差异.点睛:本题主要考查了茎叶图和独立性检验,考查学生的计算能力和分析问题的能力,贴近生活.14.(2017·全国II卷·高考真题)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg 箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较.附:P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)0.62(2)有99%的把握 (3)新养殖法优于旧养殖法【详解】试题分析:(1)由频率近似概率值,计算可得旧养殖法的箱产量低于50kg的频率为0.62.据此,事件A的概率估计值为0.62.(2)由题意完成列联表,计算K2的观测值k=≈15.705>6.635,则有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.试题解析:(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表箱产量<50kg 箱产量≥50kg旧养殖法 62 38新养殖法 34 66K2的观测值k=≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3) 由频率分布直方图可得:旧养殖法100个网箱产量的平均数1=(27.5×0.012+32.5×0.014+37.5×0.024+42.5×0.034+47.5×0.040+52.5×0.032+57.5×0.032+62.5×0.012+67.5×0.012)×5=5×9.42=47.1;新养殖法100个网箱产量的平均数2=(37.5×0.004+42.5×0.020+47.5×0.044+52.5×0.054+57.5×0.046+62.5×0.010+67.5×0.008)×5=5×10.47=52.35;比较可得:12,故新养殖法更加优于旧养殖法.点睛:利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.15.(2017·全国II卷·高考真题)(2017新课标全国II理科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下: (1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg 箱产量≥50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,【答案】(1);(2)列联表见解析,有;(3).【分析】(1)利用相互独立事件概率公式即可求得事件A的概率估计值.(2)写出列联表计算的观测值,即可确定有99%的把握认为箱产量与养殖方法有关.(3)结合频率分布直方图估计中位数为.【详解】(1)记表示事件“旧养殖法的箱产量低于” ,表示事件“新养殖法的箱产量不低于” ,旧养殖法的箱产量低于的频率为,即的估计值为0.62,新养殖法的箱产量不低于的频率为,即的估计值为0.66,因此事件A的概率估计值为.(2)根据箱产量的频率分布直方图得列联表:箱产量 箱产量 合计旧养殖法 62 38 100新养殖法 34 66 100合计 96 104 200,所以有的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于的直方图面积为,箱产量低于的直方图面积为,所以新养殖法箱产量的中位数的估计值为.考点02:线性回归相关系数的计算16.(2022·全国乙卷·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i 1 2 3 4 5 6 7 8 9 10 总和根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.【答案】(1);(2)(3)【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.【详解】(1)样本中10棵这种树木的根部横截面积的平均值样本中10棵这种树木的材积量的平均值据此可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为(2)则(3)设该林区这种树木的总材积量的估计值为,又已知树木的材积量与其根部横截面积近似成正比,可得,解之得.则该林区这种树木的总材积量估计为17.(2020·全国II卷·高考真题)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.【答案】(1);(2);(3)详见解析【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式计算即可;(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.【详解】(1)样区野生动物平均数为,地块数为200,该地区这种野生动物的估计值为(2)样本(i=1,2,…,20)的相关系数为(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.18.(2017·全国I卷·高考真题)为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序 1 2 3 4 5 6 7 8零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04抽取次序 9 10 11 12 13 14 15 16零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得,,,其中为抽取的第个零件的尺寸,.(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)附:样本的相关系数,.【答案】(1)可以;(2)(ⅰ)需要;(ⅱ),.【分析】(1)依公式求;(2)(i)由,得抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查;(ii)剔除第13个数据,则均值的估计值为10.02,方差为0.09.【详解】(1)由样本数据得的相关系数为.由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于,由样本数据可以看出抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为10.02.,剔除第13个数据,剩下数据的样本方差为,这条生产线当天生产的零件尺寸的标准差的估计值为.【点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.19.(2016·全国III卷·高考真题)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. (Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:,,,≈2.646.参考公式:相关系数回归方程中斜率和截距的最小二乘估计公式分别为:【答案】(Ⅰ)答案见解析;(Ⅱ)答案见解析.【详解】试题分析:(Ⅰ)根据相关系数的公式求出相关数据后,代入公式即可求得的值,最后根据值的大小回答即可;(Ⅱ)准确求得相关数据,利用最小二乘法建立y关于t的回归方程,然后预测.试题解析:(Ⅰ)由折线图中数据和附注中参考数据得,,,,.因为与的相关系数近似为0.99,说明与的线性相关相当高,从而可以用线性回归模型拟合与的关系.(Ⅱ)由及(Ⅰ)得,.所以,关于的回归方程为:.将2016年对应的代入回归方程得:.所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.【考点】线性相关系数与线性回归方程的求法与应用.【方法点拨】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时要严格按照公式求解,并一定要注意计算的准确性.考点03:赛事类的分布列及期望方差20.(2025·上海·高考真题)2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.206.78 207.46 207.95 209.34 209.35210.68 213.73 214.84 216.93 216.93(1)求这组数据的极差与中位数;(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒).【答案】(1);;(2)(3)【分析】(1)由最长与最短用时可得极差,由中间两数平均数可得中位数;(2)由古典概型概率公式可得;(3)先求成绩平均数,再由在回归直线上,代入方程可得,再代入年份预测可得.【详解】(1)由题意,数据的最大值为,最小值为,则极差为;数据中间两数为与,则中位数为.故极差为,中位数为;(2)由题意,数据共个,以上数据共有个,故设事件“恰有个数据在以上”,则,故恰有个数据在以上的概率为;(3)由题意,成绩的平均数,由直线过,则,故回归直线方程为.当时,.故预测年冠军队的成绩为秒.21.(2024·新课标Ⅱ卷·高考真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.(2)假设,(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?【答案】(1)(2)(i)由甲参加第一阶段比赛;(i)由甲参加第一阶段比赛;【分析】(1)根据对立事件的求法和独立事件的乘法公式即可得到答案;(2)(i)首先各自计算出,,再作差因式分解即可判断;(ii)首先得到和的所有可能取值,再按步骤列出分布列,计算出各自期望,再次作差比较大小即可.【详解】(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,比赛成绩不少于5分的概率.(2)(i)若甲先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,若乙先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,,,,应该由甲参加第一阶段比赛.(ii)若甲先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,,,,,记乙先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,同理,因为,则,,则,应该由甲参加第一阶段比赛.【点睛】关键点点睛:本题第二问的关键是计算出相关概率和期望,采用作差法并因式分解从而比较出大小关系,最后得到结论.22.(2023·新课标Ⅰ卷·高考真题)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.(1)求第2次投篮的人是乙的概率;(2)求第次投篮的人是甲的概率;(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.【答案】(1)(2)(3)【分析】(1)根据全概率公式即可求出;(2)设,由题意可得,根据数列知识,构造等比数列即可解出;(3)先求出两点分布的期望,再根据题中的结论以及等比数列的求和公式即可求出.【详解】(1)记“第次投篮的人是甲”为事件,“第次投篮的人是乙”为事件,所以,.(2)设,依题可知,,则,即,构造等比数列,设,解得,则,又,所以是首项为,公比为的等比数列,即.(3)因为,,所以当时,,故.【点睛】本题第一问直接考查全概率公式的应用,后两问的解题关键是根据题意找到递推式,然后根据数列的基本知识求解.23.(2022·全国甲卷·高考真题)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.(1)求甲学校获得冠军的概率;(2)用X表示乙学校的总得分,求X的分布列与期望.【答案】(1);(2)分布列见解析,.【分析】(1)设甲在三个项目中获胜的事件依次记为,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,的可能取值为,再分别计算出对应的概率,列出分布列,即可求出期望.【详解】(1)设甲在三个项目中获胜的事件依次记为,所以甲学校获得冠军的概率为.(2)依题可知,的可能取值为,所以,,,,.即的分布列为0 10 20 300.16 0.44 0.34 0.06期望.24.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)【答案】(1)0.4(2)(3)丙【分析】(1) 由频率估计概率即可(2) 求解得X的分布列,即可计算出X的数学期望.(3) 计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.【详解】(1)由频率估计概率可得甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3,,,.∴X的分布列为X 0 1 2 3P∴(3)丙夺冠概率估计值最大.因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为,甲获得9.80的概率为,乙获得9.78的概率为.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.25.(2021·新高考全国Ⅰ卷·高考真题)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.【答案】(1)见解析;(2)类.【分析】(1)通过题意分析出小明累计得分的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答类问题的数学期望,比较两个期望的大小即可.【详解】(1)由题可知,的所有可能取值为,,.;;.所以的分布列为(2)由(1)知,.若小明先回答问题,记为小明的累计得分,则的所有可能取值为,,.;;.所以.因为,所以小明应选择先回答类问题.26.(2020·全国I卷·高考真题)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【答案】(1);(2);(3).【分析】(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率;(2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概率;(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率.【详解】(1)记事件甲连胜四场,则;(2)记事件为甲输,事件为乙输,事件为丙输,则四局内结束比赛的概率为,所以,需要进行第五场比赛的概率为;(3)记事件为甲输,事件为乙输,事件为丙输,记事件甲赢,记事件丙赢,则甲赢的基本事件包括:、、、、、、、,所以,甲赢的概率为.由对称性可知,乙赢的概率和甲赢的概率相等,所以丙赢的概率为.【点睛】本题考查独立事件概率的计算,解答的关键就是列举出符合条件的基本事件,考查计算能力,属于中等题.27.(2019·全国II卷·高考真题)11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【答案】(1);(2)0.1【分析】(1)本题首先可以通过题意推导出所包含的事件为“甲连赢两球或乙连赢两球”,然后计算出每种事件的概率并求和即可得出结果;(2)本题首先可以通过题意推导出所包含的事件为“前两球甲乙各得分,后两球均为甲得分”,然后计算出每种事件的概率并求和即可得出结果.【详解】(1)由题意可知,所包含的事件为“甲连赢两球或乙连赢两球”所以(2)由题意可知,包含的事件为“前两球甲乙各得分,后两球均为甲得分”所以【点睛】本题考查古典概型的相关性质,能否通过题意得出以及所包含的事件是解决本题的关键,考查推理能力,考查学生从题目中获取所需信息的能力,是中档题.28.(2016·山东·高考真题)甲、乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语,在一轮活动中,如果两人都猜对,则“星队”得3分;如果只有一个人猜对,则“星队”得1分;如果两人都没猜对,则“星队”得0分.已知甲每轮猜对的概率是,乙每轮猜对的概率是;每轮活动中甲、乙猜对与否互不影响.各轮结果亦互不影响.假设“星队”参加两轮活动,求:(Ⅰ)“星队”至少猜对3个成语的概率;(Ⅱ)“星队”两轮得分之和为X的分布列和数学期望EX.【答案】(Ⅰ)(Ⅱ)分布列见解析,【详解】试题分析:(Ⅰ)找出“星队”至少猜对3个成语所包含的基本事件,由独立事件的概率公式和互斥事件的概率加法公式求解;(Ⅱ)由题意,随机变量的可能取值为0,1,2,3,4,6.由事件的独立性与互斥性,得到的分布列,根据期望公式求解.试题解析:(Ⅰ)记事件A:“甲第一轮猜对”,记事件B:“乙第一轮猜对”,记事件C:“甲第二轮猜对”,记事件D:“乙第二轮猜对”,记事件E:“‘星队’至少猜对3个成语”.由题意,由事件的独立性与互斥性,,所以“星队”至少猜对3个成语的概率为.(Ⅱ)由题意,随机变量的可能取值为0,1,2,3,4,6.由事件的独立性与互斥性,得,,,,,.可得随机变量的分布列为0 1 2 3 4 6P所以数学期望.【考点】独立事件的概率公式和互斥事件的概率加法公式,分布列和数学期望【名师点睛】本题主要考查独立事件的概率公式和互斥事件的概率加法公式、随机变量的分布列和数学期望.解答本题,首先要准确确定所研究对象的基本事件空间、基本事件个数,利用独立事件的概率公式和互斥事件的概率加法公式求解.本题较难,能很好的考查考生的数学应用意识、基本运算求解能力等.考点04:二项分布及其应用29.(2025·全国二卷·高考真题)甲、乙两人进行乒乓球练习,每个球胜者得1分,负者得0分.设每个球甲胜的概率为,乙胜的概率为q,,且各球的胜负相互独立,对正整数,记为打完k个球后甲比乙至少多得2分的概率,为打完k个球后乙比甲至少多得2分的概率.(1)求(用p表示).(2)若,求p.(3)证明:对任意正整数m,.【答案】(1),(2)(3)证明过程见解析【分析】(1)直接由二项分布概率计算公式即可求解;(2)由题意,联立,即可求解;(3)首先,,同理有,,作差有,另一方面,且同理有,作差能得到,由此即可得证.【详解】(1)为打完3个球后甲比乙至少多得两分的概率,故只能甲胜三场,故所求为,为打完4个球后甲比乙至少多得两分的概率,故甲胜三场或四场,故所求为;(2)由(1)得,,同理,若,,则,由于,所以,解得;(3)我们有.以及.至此我们得到,,同理有,.故,即.另一方面,由于且同理有.故结合,就能得到,即,证毕.30.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.(1)估计甲校高一年级学生该题选择正确的概率(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).【答案】(1)(2),(3)【分析】(1)用频率估计概率即可求解;(2)利用独立事件乘法公式以及互斥事件的加法公式可求恰有1人做对的概率及的分布列,从而可求其期望;(3)根据题设可得关于的方程,求出其解后可得它们的大小关系.【详解】(1)估计甲校高一年级学生该题选择正确的概率.(2)设为“从甲校抽取1人做对”,则,,设为“从乙校抽取1人做对”,则,,设为“恰有1人做对”,故依题可知,可取,,,,故的分布列如下表:故.(3)设为 “甲校掌握这个知识点的学生做该题”,因为甲校掌握这个知识点则有的概率做对该题目,未掌握该知识点的同学都是从四个选项里面随机选择一个,故,即,故,同理有,,故,故.31.(2023·北京·高考真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.时段 价格变化第1天到第20天 - + + 0 - - - + + 0 + 0 - - + - + 0 0 +第21天到第40天 0 + + 0 - - - + + 0 + 0 + - - - + 0 - +用频率估计概率.(1)试估计该农产品价格“上涨”的概率;(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)【答案】(1)(2)(3)不变【分析】(1)计算表格中的的次数,然后根据古典概型进行计算;(2)分别计算出表格中上涨,不变,下跌的概率后进行计算;(3)通过统计表格中前一次上涨,后一次发生的各种情况进行推断第天的情况.【详解】(1)根据表格数据可以看出,天里,有个,也就是有天是上涨的,根据古典概型的计算公式,农产品价格上涨的概率为:(2)在这天里,有天上涨,天下跌,天不变,也就是上涨,下跌,不变的概率分别是,,,于是未来任取天,天上涨,天下跌,天不变的概率是(3)由于第天处于上涨状态,从前次的次上涨进行分析,上涨后下一次仍上涨的有次,不变的有次,下跌的有次,因此估计第次不变的概率最大.32.(2023·上海·高考真题)21世纪汽车博览会在上海2023年6月7日在上海举行,下表为某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示:红色外观 蓝色外观米色内饰 8 12棕色内饰 2 3(1)若小明从这些模型中随机拿一个模型,记事件A为小明取到的模型为红色外观,事件B取到模型有棕色内饰,求,并据此判断事件A和事件B是否独立;(2)为回馈客户,该公司举行了一个抽奖活动,并规定,在一次抽奖中,每人可以一次性抽取两个汽车模型。为了得到奖品类型,现作出如下假设:假设1:每人抽取的两个模型会出现三种结果:①两个模型的外观和内饰均为同色;②两个模型的外观和内饰均为不同色;③两个模型的外观同色但内饰不同色,或内饰同色但外观不同色。假设2:该抽奖设置三类奖,奖金金额分别为:一等奖600元,二等奖300元,三等奖150元。假设3:每种抽取的结果都对应一类奖。出现某种结果的概率越小,奖金金额越高。请判断以上三种结果分别对应几等奖。设中奖的奖金数是,写出的分布,并求的数学期望。【答案】(1),事件相互独立;(2)分布列见解析,271元.【分析】(1)根据给定数表,利用古典概率求出,再利用相互独立事件的定义判断作答.(2)求出三种结果的概率,按给定的假设2,3确定奖金额与对应的概率列出分布列,求出期望作答.【详解】(1)由给定的数表知,,,,而,因此事件相互独立,所以,事件相互独立.(2)设事件:外观和内饰均为同色,事件:外观内饰都异色,事件:仅外观或仅内饰同色,依题意,;;,则,因此抽取的两个模型的外观和内饰均为不同色是一等奖;外观和内饰均为同色是二等奖;外观同色但内饰不同色,或内饰同色但外观不同色是三等奖,奖金额的可能值为:,奖金额的分布列:600 300 150奖金额的期望(元).33.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图: (1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间的概率;(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)岁;(2);(3).【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设{一人患这种疾病的年龄在区间},根据对立事件的概率公式即可解出;(3)根据条件概率公式即可求出.【详解】(1)平均年龄 (岁).(2)设“一人患这种疾病的年龄在区间”,所以.(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,则由已知得:,则由条件概率公式可得从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.34.(2018·全国I卷·高考真题)某工厂的某种产品成箱包装,每箱件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.(1)记件产品中恰有件不合格品的概率为,求的最大值点;(2)现对一箱产品检验了件,结果恰有件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为元,若有不合格品进入用户手中,则工厂要对每件不合格品支付元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【答案】(1);(2)(i);(ii)应该对余下的产品作检验.【分析】(1)方法一:利用独立重复实验成功次数对应的概率,求得,之后对其求导,利用导数在相应区间上的符号,确定其单调性,从而得到其最大值点,这里要注意的条件;(2)方法一:先根据第一问的条件,确定出,在解(i)的时候,先求件数对应的期望,之后应用变量之间的关系,求得赔偿费用的期望;在解(ii)的时候,就通过比较两个期望的大小,得到结果.【详解】(1)[方法一]:【通性通法】利用导数求最值件产品中恰有件不合格品的概率为.因此.令,得.当时,;当时,.所以的最大值点为;[方法二]:【最优解】均值不等式由题可知,20件产品中恰有2件不合格品的概率为.,当且仅当,即可得所求.(2)由(1)知,.(i)令表示余下的件产品中的不合格品件数,依题意知,,即.所以.(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于,故应该对余下的产品作检验.【整体点评】(1)方法一:利用导数求最值,是求函数最值的通性通法;方法二:根据所求式子特征,利用均值不等式求最值,是本题的最优解.35.(2019·天津·高考真题)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(Ⅰ)用表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量的分布列和数学期望;(Ⅱ)设为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件发生的概率.【答案】(Ⅰ)见解析;(Ⅱ)【分析】(Ⅰ)由题意可知分布列为二项分布,结合二项分布的公式求得概率可得分布列,然后利用二项分布的期望公式求解数学期望即可;(Ⅱ)由题意结合独立事件概率公式计算可得满足题意的概率值.【详解】(Ⅰ)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为,故,从面.所以,随机变量的分布列为:0 1 2 3随机变量的数学期望.(Ⅱ)设乙同学上学期间的三天中7:30之前到校的天数为,则.且.由题意知事件与互斥,且事件与,事件与均相互独立,从而由(Ⅰ)知:.【点睛】本题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.36.(2020·北京·高考真题)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:男生 女生支持 不支持 支持 不支持方案一 200人 400人 300人 100人方案二 350人 250人 150人 250人假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案二的概率估计值记为,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为,试比较与 的大小.(结论不要求证明)【答案】(Ⅰ)该校男生支持方案一的概率为,该校女生支持方案一的概率为;(Ⅱ),(Ⅲ)【分析】(Ⅰ)根据频率估计概率,即得结果;(Ⅱ)先分类,再根据独立事件概率乘法公式以及分类计数加法公式求结果;(Ⅲ)先求,再根据频率估计概率,即得大小.【详解】(Ⅰ)该校男生支持方案一的概率为,该校女生支持方案一的概率为;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:;(Ⅲ)【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.37.(2018·北京·高考真题)电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型 第一类 第二类 第三类 第四类 第五类 第六类电影部数 140 50 300 200 800 510好评率 0.4 0.2 0.15 0.25 0.2 0.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“”表示第k类电影得到人们喜欢,“”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差,,,,,的大小关系.【答案】(1) 概率为0.025(2) 概率估计为0.35(3) >>=>>【详解】分析:(1)先根据频数计算是第四类电影的频率,再乘以第四类电影好评率得所求概率,(2) 恰有1部获得好评为第四类电影获得好评第五类电影没获得好评和第四类电影没获得好评第五类电影获得好评这两个互斥事件,先利用独立事件概率乘法公式分别求两个互斥事件的概率,再相加得结果,(3) 服从0-1分布,因此,即得>>=>>.详解:解:(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000,第四类电影中获得好评的电影部数是200×0.25=50.故所求概率为.(Ⅱ)设事件A为“从第四类电影中随机选出的电影获得好评”,事件B为“从第五类电影中随机选出的电影获得好评”.故所求概率为P()=P()+P()=P(A)(1–P(B))+(1–P(A))P(B).由题意知:P(A)估计为0.25,P(B)估计为0.2.故所求概率估计为0.25×0.8+0.75×0.2=0.35.(Ⅲ)>>=>>.点睛:互斥事件概率加法公式:若A,B互斥,则P(A+B)=P(A)+P(B),独立事件概率乘法公式:若A,B相互独立,则P(AB)=P(A)P(B).38.(2016·全国II卷·高考真题)某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数 0 1 2 3 4保费设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数 0 1 2 3 4概率 0.30 0.15 0.20 0.20 0.10 0.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出的概率;(Ⅲ)求续保人本年度的平均保费与基本保费的比值.【答案】(Ⅰ)0.55;(Ⅱ);(Ⅲ)1.23.【详解】试题分析:试题解析:(Ⅰ)设表示事件:“一续保人本年度的保费高于基本保费”,则事件发生当且仅当一年内出险次数大于1,故(Ⅱ)设表示事件:“一续保人本年度的保费比基本保费高出”,则事件发生当且仅当一年内出险次数大于3,故又,故因此所求概率为(Ⅲ)记续保人本年度的保费为,则的分布列为因此续保人本年度的平均保费与基本保费的比值为【考点】条件概率,随机变量的分布列、期望【名师点睛】条件概率的求法:(1)定义法:先求P(A)和P(AB),再由P(B|A)=,求出P(B|A);(2)基本事件法:当基本事件适合有限性和等可能性时,可借助古典概型概率公式,先求事件A包含的基本事件数n(A),再在事件A发生的条件下求事件B包含的基本事件数n(AB),得P(B|A)=.求离散型随机变量均值的步骤:(1)理解随机变量X的意义,写出X可能取得的全部值;(2)求X取每个值时的概率;(3)写出X的分布列;(4)由均值定义求出EX.39.(2016·北京·高考真题)A,B,C三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时):A班 6 6.5 7 7.5 8B班 6 7 8 9 10 11 12C班 3 4.5 6 7.5 9 10.5 12 13.8(Ⅰ)试估计C班的学生人数;(Ⅱ)从A班和C班抽出的学生中,各随机选取一人,A班选出的人记为甲,C班选出的人记为乙.假设所有学生的锻炼时间相互独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;(Ⅲ)再从A,B,C三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时).这3个新数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为,试判断和的大小.(结论不要求证明)【答案】(Ⅰ)40;(Ⅱ);(III).【详解】试题分析:(Ⅰ)根据图表,结合分层抽样的抽样比计算C班的学生人数;(Ⅱ)根据题意列出“该周甲的锻炼时间比乙的锻炼时间长”的所有事件,由相互独立事件概率公式求解.(Ⅲ)根据平均数公式进行判断即可.试题解析:(Ⅰ)由题意知,抽出的名学生中,来自C班的学生有名.根据分层抽样方法,C班的学生人数估计为.(Ⅱ)设事件为“甲是现有样本中A班的第个人”,,事件为“乙是现有样本中C班的第个人”,,由题意可知,,;,.,,.设事件为“该周甲的锻炼时间比乙的锻炼时间长”.由题意知,.因此.(Ⅲ).【考点】分层抽样、相互独立事件的概率、平均数【名师点睛】求复杂的互斥事件的概率的方法:一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是间接法,先求此事件的对立事件的概率,再用公式,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.考点05:概率统计的实际应用40.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:赔偿次数 0 1 2 3 4单数假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.(1)估计一份保单索赔次数不少于2的概率;(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.(i)记为一份保单的毛利润,估计的数学期望;(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)【答案】(1)(2)(i)0.122万元;(ii) 这种情况下一份保单毛利润的数学期望估计值大于(i)中估计值【分析】(1)根据题设中的数据可求赔偿次数不少2的概率;(2)(ⅰ)设为赔付金额,则可取,用频率估计概率后可求的分布列及数学期望,从而可求.(ⅱ)先算出下一期保费的变化情况,结合(1)的结果可求,从而即可比较大小得解.【详解】(1)设为“随机抽取一单,赔偿不少于2次”,由题设中的统计数据可得.(2)(ⅰ)设为赔付金额,则可取,由题设中的统计数据可得,,,,故故(万元).(ⅱ)由题设保费的变化为,故(万元),从而.41.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率%时,求临界值c和误诊率;(2)设函数,当时,求的解析式,并求在区间的最小值.【答案】(1),;(2),最小值为.【分析】(1)根据题意由第一个图可先求出,再根据第二个图求出的矩形面积即可解出;(2)根据题意确定分段点,即可得出的解析式,再根据分段函数的最值求法即可解出.【详解】(1)依题可知,左边图形第一个小矩形的面积为,所以,所以,解得:,.(2)当时,;当时,,故,所以在区间的最小值为.42.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:试验序号 1 2 3 4 5 6 7 8 9 10伸缩率 545 533 551 522 575 544 541 568 596 548伸缩率 536 527 543 530 560 533 522 550 576 536记,记的样本平均数为,样本方差为.(1)求,;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)【答案】(1),;(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.【分析】(1)直接利用平均数公式即可计算出,再得到所有的值,最后计算出方差即可;(2)根据公式计算出的值,和比较大小即可.【详解】(1),,,的值分别为: ,故(2)由(1)知:,,故有,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.43.(2021·全国乙卷·高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.(2)根据题目所给判断依据,结合(1)的结论进行判断.【详解】(1),,,.(2)依题意,,,,所以新设备生产产品的该项指标的均值较旧设备有显著提高.44.(2019·全国III卷·高考真题)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1) ,;(2) ,.【分析】(1)由及频率和为1可解得和的值;(2)根据公式求平均数.【详解】(1)由题得,解得,由,解得.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,乙离子残留百分比的平均值为【点睛】本题考查频率分布直方图和平均数,属于基础题.45.(2020·全国I卷·高考真题)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数 40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数 28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务 【答案】(1)甲分厂加工出来的级品的概率为,乙分厂加工出来的级品的概率为;(2)选甲分厂,理由见解析.【分析】(1)根据两个频数分布表即可求出;(2)根据题意分别求出甲乙两厂加工件产品的总利润,即可求出平均利润,由此作出选择.【详解】(1)由表可知,甲厂加工出来的一件产品为级品的概率为,乙厂加工出来的一件产品为级品的概率为;(2)甲分厂加工件产品的总利润为元,所以甲分厂加工件产品的平均利润为元每件;乙分厂加工件产品的总利润为元,所以乙分厂加工件产品的平均利润为元每件.故厂家选择甲分厂承接加工任务.【点睛】本题主要考查古典概型的概率公式的应用,以及平均数的求法,并根据平均值作出决策,属于基础题.46.(2020·江苏·高考真题)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为Xn,恰有2个黑球的概率为pn,恰有1个黑球的概率为qn.(1)求p1,q1和p2,q2;(2)求2pn+qn与2pn-1+qn-1的递推关系式和Xn的数学期望E(Xn)(用 n表示) .【答案】(1)(2);.【分析】(1)直接根据操作,根据古典概型概率公式可得结果;(2)根据操作,依次求,即得递推关系,构造等比数列求得,最后根据数学期望公式求结果.【详解】(1),,.(2),,因此,从而,即.又的分布列为0 1 2故.【点睛】本题考查古典概型概率、概率中递推关系、构造法求数列通项、数学期望公式,考查综合分析求解能力,属难题.47.(2019·北京·高考真题)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下: 交付金额(元) 支付方式 (0,1000] (1000,2000] 大于2000仅使用A 18人 9人 3人仅使用B 10人 14人 1人(Ⅰ)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(Ⅰ) ;(Ⅱ)见解析;(Ⅲ)见解析.【分析】(Ⅰ)由题意利用古典概型计算公式可得满足题意的概率值;(Ⅱ)首先确定X可能的取值,然后求得相应的概率值可得分布列,最后求解数学期望即可.(Ⅲ)由题意结合概率的定义给出结论即可.【详解】(Ⅰ)由题意可知,两种支付方式都是用的人数为:人,则:该学生上个月A,B两种支付方式都使用的概率.(Ⅱ)由题意可知,仅使用A支付方法的学生中,金额不大于1000的人数占,金额大于1000的人数占,仅使用B支付方法的学生中,金额不大于1000的人数占,金额大于1000的人数占,且X可能的取值为0,1,2.,,,X的分布列为:X 0 1 2其数学期望:.(Ⅲ)我们不认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化.理由如下:随机事件在一次随机实验中是否发生是随机的,是不能预知的,随着试验次数的增多,频率越来越稳定于概率.学校是一个相对消费稳定的地方,每个学生根据自己的实际情况每个月的消费应该相对固定,出现题中这种现象可能是发生了“小概率事件”.(答案不唯一,小概率事件发生也可认为是人数发生了变化)【点睛】本题以支付方式相关调查来设置问题,考查概率统计在生活中的应用,考查概率的定义和分布列的应用,使学生体会到数学与现实生活息息相关.48.(2019·北京·高考真题)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(Ⅰ)估计该校学生中上个月A,B两种支付方式都使用的人数;(Ⅱ)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元.结合(Ⅱ)的结果,能否认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(Ⅰ)400人;(Ⅱ);(Ⅲ)见解析.【分析】(Ⅰ)由题意利用频率近似概率可得满足题意的人数;(Ⅱ)利用古典概型计算公式可得上个月支付金额大于2000元的概率;(Ⅲ)结合概率统计相关定义给出结论即可.【详解】(Ⅰ)由图表可知仅使用A的人数有30人,仅使用B的人数有25人,由题意知A,B两种支付方式都不使用的有5人,所以样本中两种支付方式都使用的有,所以全校学生中两种支付方式都使用的有(人).(Ⅱ)因为样本中仅使用B的学生共有25人,只有1人支付金额大于2000元,所以该学生上个月支付金额大于2000元的概率为.(Ⅲ)由(Ⅱ)知支付金额大于2000元的概率为,因为从仅使用B的学生中随机调查1人,发现他本月的支付金额大于2000元,依据小概率事件它在一次试验中是几乎不可能发生的,所以可以认为仅使用B的学生中本月支付金额大于2000元的人数有变化,且比上个月多.【点睛】本题主要考查古典概型概率公式及其应用,概率的定义与应用等知识,意在考查学生的转化能力和计算求解能力.49.(2018·全国II卷·高考真题)下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)利用模型①预测值为226.1,利用模型②预测值为256.5,(2)利用模型②得到的预测值更可靠.【详解】分析:(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果;(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.详解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.50.(2019·全国II卷·高考真题)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.的分组企业数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:.【答案】(1) 增长率超过40%的企业比例为,产值负增长的企业比例为;(2)平均数;标准差.【分析】(1)本题首先可以通过题意确定个企业中增长率超过40%的企业以及产值负增长的企业的个数,然后通过增长率超过40%的企业以及产值负增长的企业的个数除随机调查的企业总数即可得出结果;(2)可通过平均值以及标准差的计算公式得出结果.【详解】(1)由题意可知,随机调查的个企业中增长率超过40%的企业有个,产值负增长的企业有个,所以增长率超过40%的企业比例为,产值负增长的企业比例为(2)由题意可知,平均值2+0.10.24+0.3053+0.514+0.77)=0.30,标准差的平方:===0.0296所以标准差【点睛】本题考查平均值以及标准差的计算,主要考查平均值以及标准差的计算公式,考查学生从信息题中获取所需信息的能力,考查学生的计算能力,是简单题.51.(2018·全国I卷·高考真题)某家庭记录了未使用节水龙头天的日用水量数据(单位:)和使用了节水龙头天的日用水量数据,得到频数分布表如下:未使用节水龙头天的日用水量频数分布表日用水量频数使用了节水龙头天的日用水量频数分布表日用水量频数(1)作出使用了节水龙头天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析;(2);(3).【分析】(1)根据题中所给的使用了节水龙头天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图;(2)结合直方图,算出日用水量小于的矩形的面积总和,即为所求的频率;(3)根据组中值乘以相应的频率作和求得天日用水量的平均值,作差乘以天得到一年能节约用水多少,从而求得结果.【详解】(1)频率分布直方图如下图所示:(2)根据以上数据,该家庭使用节水龙头后天日用水量小于的频率为;因此该家庭使用节水龙头后日用水量小于的概率的估计值为;(3)该家庭未使用节水龙头天日用水量的平均数为.该家庭使用了节水龙头后50天日用水量的平均数为.估计使用节水龙头后,一年可节省水.【点睛】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.52.(2018·天津·高考真题)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I)应从甲、乙、丙三个部门的员工中分别抽取多少人?(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望; 展开更多...... 收起↑ 资源列表 十年(2016-2025)高考数学真题分类汇编(全国通用)专题08概率统计及数字特征解答题综合(五大考点,61题)(学生版).docx 十年(2016-2025)高考数学真题分类汇编(全国通用)专题08概率统计及数字特征解答题综合(五大考点,61题)(教师版).docx