【高考解密】2025年高考数学大题类型与解法--概率和统计综合问题

资源下载
  1. 二一教育资源

【高考解密】2025年高考数学大题类型与解法--概率和统计综合问题

资源简介

8
概率和统计综合问题高考大题的类型与解法
概率和统计综合问题是近几年高考的热点问题之一,可以这样毫不夸张地说,只要是数学高考试卷,都必有一个概率和统计综合问题的12分大题。从题型上看是18(或19)题的12分大题,难度系数为中,低档,一般考生都会拿到9到12分。纵观近几年高考试卷,归结起来概率和统计综合大题问题主要包括:①统计表(或统计图)与随机变量分布列和随机变量数学期望的综合问题;②概率与统计中22列联表的综合问题;③概率与统计中线性回归方程的综合问题;④概率与统计指标的综合问题;⑤概率与简单随机抽样的综合问题等几种类型。各种类型问题结构上具有一定的特征,解答方法也有一定的规律可寻。那么在实际解答概率和统计综合大题问题时,到底应该如何抓住问题的结构特征,快捷,准确地解答问题呢?下面通过典型例题的详细解析来回答这个问题。
【典例1】解答下列问题:
某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段
由参赛队中的一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段,由该队的另一名队员投篮3次,每次投中得5分,未投中得0分,该队的比赛成绩为第二阶段得分的总和。某参赛对由甲,乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立。(2024全国高考新高考II)
(1)若p=0.4,q=0.5,甲参加第一阶段比赛,求甲,乙所在队的比赛成绩不少于5分的概率;
(2)假设0<p<q。
①为使得甲,乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段的比赛?
②为使得甲,乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段的比赛?
2、(理)某省举办了一次高三年级化学模拟考试,其中甲市有10000名学生参考,根据经验,该省及各市本次模拟考试成绩(满分100分)都近似服从正态分布N(u,)。
(1)已知本次模拟考试甲市平均成绩为65分,87分以上共有228人,甲市学生A的成绩为76分,试估计学生A在甲市的大致名次;
(2)在该省本次模拟考试的参考学生中随机抽取40人,记X表示在本次考试中化学成绩在(u-3,u+3)之外的人数,求P(X≥1)的概率及X的数学期望。
参考数据:0.9011,参考公式:若XN(u,),有P(u-(文)2024年1月,某市的高二调研考试首次采用了“3+1+2”新高考模式,该模式下,计算学生个人总成绩时,“3+1”的学科均以原始分记入,再选的“2”个学科(学生在政治,地理,化学,生物中选修的2科)以赋分成绩记入,赋分成绩的具体算法是:先将该市某再选科目原始成绩按从高到低划分为A,B,C,D,E五个等级,各等级人数所占比例分别约为15%,35%,35%,13%,2%,依照转换公式,将五个等级的原始分分别转换到10086,8571,7056,5541,4030五个分数区间,并对所得分数的小数点后一位进行“四舍五入”,最后得分保留为整数的转换分成绩,并作为赋分成绩,具体等级比例和赋分区间如下表:已知该市本次高二调研考试化学科目考试成绩满分为100分。
(1)已知转换公式符合一次函数模型,若学生甲,乙在本次考试中化学成绩分别为84,78,转换分成绩为78,71,试估算该市本次化学原始成绩B等级中的最高分;
(2)现从该市本次高二调研考试的化学成绩中随机选取100名学生的原始成绩进行分析,其频率分布直方图如图所示,求出图中a的值,并用样本估计总体的方法,估计该市本次化学原始成绩B等级中的最低分。
3、某市为了解中学生的课外阅读情况,从该市全体中学生中随机抽取了500名学生,调查他们在寒假期间每天课外阅读平均时长t(单位:分钟)得到如表所示的频数分布表,已知所调查的学生中寒假期间每天课外阅读平均时长不超过100分钟。
时长t [0,20) [20,40) [40,60) [60,80) [80,100]
学生人数 50 100 200 125 25
估计这500名学生寒假期间每天课外阅读平均时长(同一组中的数据用该
组区间的中点值为代表);
(2)(理)用频率估计概率,从该市中学生中随机抽取2名学生参加座谈,抽到的学生寒假期间每天课外阅读平均时长在[0,20)内记0分,在[20,60)内记1分,在[60,100]内记2分,用X表示这两名学生得分之和,求X的分布列和数学期望。(文)若按照分层抽样的方法从本次调查中寒假期间每天课外阅读平均时长在[0,20)和[20,40)的两组中共抽取6人进行问卷调查,并从6人中随机选取2人进行座谈,求这2人中至少有一人寒假期间每天课外阅读平均时长在[0,20)的概率。
4、“十四五”时期,成都基于历史文化底蕴,独特资源 赋,生活城市特质和市民美好生活需要,高水平推进“三城三都”(世界文创名城,旅游名城,赛事名城和国际美食之都,音乐之都,会展之都)建设,2023年,成都大运会的成功举办让赛事名城的形象深入人心,让世界看到成都的专业,活力和对体育的热爱;2024年,相约去凤凰山体育场观看成都蓉城队的比赛已经成为成都人最时尚的生活方式之一,已知足球比赛积分规则为:球队胜一场积3分,平一场积1分,负一场积0分,成都蓉城队2024年七月还将迎来主场与A对和客场与B队的两场比赛,根据前期比赛成绩,设成都蓉城队主场与A队比赛取胜的概率为,平的概率为,负的概率为;客场与B队比赛取胜的概率为,平的概率为,负的概率为,且两场比赛结果相互独立。
求成都蓉城队七月主场与A队比赛获得积分超过客场与B队比赛获得积分的概率;
用X表示成都蓉城队七月与A队和B队比赛获得积分之和,求X的分布列与期望。
5、甲,乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮。无论之前投篮情况如何,甲每次投篮命中率均为0.6,乙每次投篮命中率均为0.8,由抽签确定第一次投篮的人选,第一次投篮的人是甲,乙的概率各为0.5。
(1)求第二次投篮的人是乙的概率;
(2)求第i次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且p(=1)=1-p(=0)=qi,i=1,2,---n,
则E()=,记前n次(即从第一次到第n次)投篮中甲投篮的次数为Y,求E(Y)(2023全国高考新高考I)。
6、甲,乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局,三个项目比赛结束后,总得分高的学校获得冠军,已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立。
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与数学期望(2022全国高考甲卷理)
7、某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确,则从另一类问题中在随机抽取一个问题回答,无论回答正确与否,该同学比赛结束。A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分。已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关(2021全国高考新高考I卷)。
(1)若小明先回答A类问题,记X为小明累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应该选择先回答哪类问题?并说明理由。
8、《营造法式》是中国北宋时期官方颁布的一部建筑设计与施工的书籍,标志着我国古代建筑技术和工艺发展到了较高水平,中国近代建筑之父梁恩成用现代语言和制图方法对该书进行了注释,著有《(营造法式)注释》,为了让建筑类学生了解古建筑设计与构造的原理,某建筑大学为大三和大四的学生开设了一门选修课程《营造法式及其注释》,为检测学生学习效果,要求所有选修该门课程的学生完成“应用营造法式独立制作一件古建筑模型”的作业,已知选修该门课程的大三与大四学生的人数之比为3:2,现用分层抽样的方法从所有作业中随机抽取100份(每位学生均上交一份作业),并评出成绩,得到如下频率分布表:
(理)(1)求x,y的值,并估计这100份作业中大三学生作业的平均成绩(同一组中的数据用该组区间的中点值为代表);
在这100份作业的样本中,从成绩在[50,80)的大四学生作业中随机抽取2份,记抽取的这2份作业中成绩在[60,70)的份数为X,求X的分布列与数学期望。
成绩(单位:分) [50,60) [60,70) [70,80) [80,90) [90,100)
频数(不分年级) 4 x 20 38 30
频数(大三年级) 3 6 15 y 12
(文)(1)求y的值,若以频率作为概率,从选修该门课程的大四学生中随机选取1名,试估计该学生的作业成绩在[60,80)的概率;
(2)估计这100份作业中大三学生作业的平均成绩(同一组中的数据用该组区间的中点值为代表)(2021成都市高三三诊)
〖思考问题1〗
(1)【典例1】是统计,随机变量分布列和数学期望综合的问题,解答这类问题需要理解随机事件概率,统计图,随机变量分布列和数学我的基本概念;掌握求随机事件概率,随机变量概率分布列与数学期望的基本求法和统计表(或统计图)的性质与基本作法;
(2)求某事件的概率,根据统计表(或统计图),结合随机事件概率的计算公式通过运算就可求出某个事件的概率;运用统计表(或统计图)解答相关问题时,应该根据问题条件确定统计表(或统计图)属于哪一种类型,结合这种统计表(或统计图)的性质实施问题的解答;求随机变量概率分布列(或数学期望)的基本方法是:①确定随机变量的可能取值;②分别求出各随机变量值的概率;③得到随机变量概率分布列,从而求出随机变量的数学期望。
[练习1]解答下列问题:
1、2019年12月,《生活垃圾分类标志》新标准发布并正式实施,为进一步普及生活垃圾分类知识,了解居民生活垃圾分类情况,某社区开展了一次关于垃圾分类的问卷调查活动,并对随机抽取的1000人的年龄进行了统计,得到如下的各年龄段频数分布表和各年龄段人数频率分布直方图:
(1)请补全各年龄段人数频率分布直方图,并求出各年龄段频数分布表中m,n的值;
(2)现从年龄在,[30,40)段中采用分层抽样的方法选取5名代表参加垃圾分类知识交流活动,应社区要求,从被选中的这5名代表中任意选2名作交流发言,求选取的2名发言者中恰有1名年龄段在[35,40)段中的概率(2021成都市高三零诊)。
2、2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮,某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:分钟)将学生分成六个组:[0,20),[20,40),[40,60),[60,80),[80,100),[100,120],经统计得到了如图所示的频率分布直方图(2019成都市高三零诊)。
(1)求频率分布直方图中a的值;并估计该校文学院的学生每天诵读诗词的时间的平均数;
(2)若两个同学诵读诗词的时间x,y满足|x-y|>60,则这两个同学组成一个“Tean”,已知从每天诵读诗词的时间小于20分钟和大于或等于80分钟的所有学生中用分层抽样的方法抽取了5人,现从这5人中随机选取2人,求选取的两人能组成一个“Tean”的概率。
3、(理)某部门为了解企业在生产过程中的用水量情况,对每 7 3 1
天的用水量作了记录,得到了大量该企业的日用水量的统计数据, 8 3 5 6 7 8 9
从这些统计数据中随机抽取12天的数据作为样本,得到如图所 9 5 7 8 9
示的茎叶图(单位:吨),若用水量不低于95吨,则称这一天
的用水量超标。
(1)从这12天的数据中随机抽取3个,求至多有1天用水量超标的概率;
(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X为未来3天中用水量超标的天数,求X的分布列和数学期望。
(文)某部门为了解企业在生产过程中的用水量 日用水量 [70,80)[80,90)[90,100]
情况,对每天的用水量作了记录,得到了该企业(单位:吨)
的日用水量的统计数据,从这些统计数据中随机 频数 3 6 m
抽取12天的用水量的数据作为样本,得到的统 频率 n 0.5 p
计结果如右表:(2018成都市高三一诊)
(1)求m,n,p的值;
(2)已知样本中日用水量在[80,90)内的这六个数据分别为83,85,86,87,88,89,从六个数据中随机抽取两个,求抽取的两个数据中至少有一个大于86的概率。
4、(理)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完。根据往年销售经验,每天需求量与当天最高气温(单位:)有关,如果气温不低于25,需求量为500瓶;如果气温位于区间[20,25),需求量为300瓶;如果气温低于20,需求量为200瓶。为了确定6月份的订购计划,统计了前三年六月份各天的最高气温数据,得到下面的频率分布表:
最高气温 [10,15)[15,20)[20,25)[25,30)[30,35)[35,40)
天数 2 16 36 25 7 4
以最高气温位于各区间的频率代替最高气温位于该区间的概率(2017全国高考新课标III卷)。
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,y的数学期望达到最大值?
(文)(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出y的所有可能值,并估计y大于零的概率。
【典例2】解答下列问题:
1、某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲,乙两个车间的产品中随
机抽取了150件进行检验,数据如下:
优级品 合格品 不合格品 总计 优级品 非优级品
甲车间 26 24 0 50 甲车间
乙车间 70 28 2 100 乙车间
总计 96 52 2 150
填写如表列联表,能否有95%的把握认为甲,乙两车间产品的优级品率存在差异?
能否有99%的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品优级品率p=0.5,设为升级改造后抽取的n件产品的优
级品率,如果>p+1.65,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?
参考数据:12.247,=,(2024全国高考甲卷)
p(≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
某校高中阶段实行体育模块化课程教学,在高一年级开设了篮球和羽毛球两个模块课
程,从该校高一年级随机抽取的100名男生和100名女生中,统计出参加上述课程的情况如下:
男生 女生 总计
参加篮球模块课程人数 60 20 80
参加羽毛球模块课程人数 40 80 120
总计 100 100 200
根据上述列联表,是否有99.9%的把握认为该校高一年级体育模块化课程的选择与性别有关;
(2)(理)根据抽取的200名学生的模块化课程成绩,每个模块课程的前3名获得参加体育模块化教学推广大使的评选资格,若在有评选资格的6名学生中随机选出2人作为体育模块化课程教学的推广大使,记这两人中来自篮球模块化课程的人数为X,求X的分布列和期望。(文)根据抽取的200名学生的模块化课程成绩,每个模块课程的前3名获得参加体育模块化教学推广大使的评选资格,若在有评选资格的6名学生中随机选出2人作为体育模块化课程教学的推广大使,求这2人来自不同模块化课程的概率。
附:=, P(≥)0.025 0.010 0.005 0.001
5.024 6.635 7.879 10.828
3、(理)为探究某箹物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加箹物)和实验组(加箹物)。
(1)设其中两只小鼠中,对照组小鼠数目为X,求X的分布列和数学期望;
(2)测得40只小鼠体重如下(单位:g),(已按从小到大排好)。
对照组:17.3,18.4,20..1,20.4,21..3,23..2,24.6, 24.8, 25.0, 25.4, 26.1, 26.3,26.4, 26.5, 26.8, 27.0, 27.4, 27.5, 27.6, 28.3;
实验组:3.4, 6.6, 6.8, 6.9, 7.8, 8.2, 9.4, 10.0, 10.4, 11.2, 14.4, 17.3,
19.2, 20.2, 23.6, 23.8, 24.3, 25.1, 25.2, 26.0。
①求40只小鼠体重的中位数m,并完成下面22列联表:
②根据22列联表,能否有95%的把握认为箹物对小鼠生长有抑制作用。
对照组 6 14 20 k 0.10 0.05 0.01
实验组 14 6 20 p(≥k) 2.716 3.541 6.615
合计 20 20 40
(文)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在搞浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g),试验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2,18.8,20..2,21.3,22..5,23..2,25.8, 26.5, 27.5, 30.1, 32.6, 34.3,34.8, 35.6, 35.6, 35.8, 36.2, 37.3, 40.5, 43.2;
试验组的小白鼠体重的增加量从小到大排序为:7.8, 9.2, 11.4, 12.4, 13.2, 15.5, 16.5, 18.0, 18.8, 19.2, 19.8, 20.2,21.6, 22.8, 23.6, 23.9, 25.1, 28.2, 32.3, 36.5。
(1)计算试验组的样本平均数;
(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本在小于m与不小于m的
数据的个数,完成如下表22列联表:
②根据①中的22列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?(2023全国高考甲卷)
附:=
对照组 6 14 20 k 0.100 0.050 0.010
实验组 14 6 20 p (≥k) 2.706 3.841 6.635
合计 20 20 40
4、某中学为了丰富学生的课余生活,欲利用每周一下午的自主活动时间,面向本校高二学生开设“厨艺奥秘”,“金景栽培”,“家庭摄影”,“名画鉴赏”四门选修课,由学生自主申报,每人只能报一门,也可以不报。该校高二有两种班型-文科班和理科班(各由2个班),据调查这四个中有100人报名参加了本次选修课,报名情况统计如下表:
厨艺奥秘 金景栽培家庭摄影名画鉴赏 课程类型 课 程 合计
文科1班 11 5 14 6 劳育课程 美育课程
文科2班 12 7 11 4 文科班 35 35 70
理科1班 3 1 9 3 理科班 10 20 20
理科2班 5 1 6 2 合计 45 55 100
若把“厨艺奥秘”,“金景栽培”统称为“劳育课程”,把“家庭摄影”,“名画鉴赏”统称为“美育课程”,请根据所给数据完成以上22列联表;
根据(1)列联表所填数据,判断是否有99%的把握认为课程的选择与班型有关。附:
= (成都市高2020级高三二诊)
p( >)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.01 0.005
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879
5、甲,乙两城之间的长途客车均由A和B两家公司运载, 准点班次数 未准点班次数
为了解这两家公司长途客车的运行情况,随机调查了甲 A 240 20
、乙两城之间的500个班次,得到如表所示的列联表: B 210 30
(1)根据上表,分别估计两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
(2022全国高考甲卷文)
6、一医疗团队为研究某地的一种地方性疾病与 不够良好 良好
当地居民的卫生习惯(卫生习惯分为良好和不够 病例组 40 60
良好两类)的关系,在已患该疾病的病例中随机 对照组 10 90
调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),
得到如表所示的数据:
能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件
“选到的人患有该疾病”, 与的比值是卫生习惯不够良好对患该疾病
风险程度的一项指标,记该指标为R。
①证明:R=.;
②利用该调查数据,给出p(A|B),的估计值,并利用①的结果给出R的估计值(2022全国高考新高考I卷)
附:,。
7、甲,乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床,乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?(2021全国高考甲卷)
8、以网络公司为某贫困山区培养了100名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富,该公司将这100名“乡土直播员”中每天直播时间不少于5小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”,根据实际评选结果得到了下面22列联表: 网红乡土直播员 乡土直播达人 合计
(1)根据列联表判断是否有95%的把握认 男 10 40 50
为“网红乡土直播员”与性别有关? 女 20 30 50
(2)(理)在“网红乡土直播员”按分层抽样 合计 30 70 100
方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”中男性人数为,求的分布列和期望。
(文)在“网红乡土直播员”按分层抽样方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”,求这俩人中恰有一男一女的概率(2021成都市高三一诊)
附:
(其中n=a+b+c+d)
〖思考问题2〗
【典例2】是概率与统计中独立性检验综合的问题,解答这类问题需要理解古典概率,22列联表,两个变量相关的基本概念;掌握古典概率,22列联表,两个变量相关系数的求法和判断两个变量是否相关的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个
事件的概率;22列联表依据统计表可以直接列出,求相关系数时,需要根据22列联表和相关公式通过运算就可求出,判定两个变量是否相关的基本方法是:①作出变量的散点图,根据变量散点图进行判断;②运用公式求出相关系数的值,根据相关系数的值进行判断。
[练习2]解答下列问题:
1、某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天)
锻炼人次 (0,200] (200,400] (400,600]
空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”,若某天的空气质量等级为3或4,则称这天“空气质量不好”。根据所给数据,完成下面22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?(2020全国高考新课标III)
人次400 人次>400
空气质量好
空气质量不好
附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
2、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和S浓度(单位:ug/),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率;
S [0,50] (50,150] (150,475]
PM2.5
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(2)根据所给数据,完成下面22列联表:
S [0,150] (150,475]
PM2.5
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与S浓度有关?(2020全国高考新高考I)
赋:附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
3、某公司有1000名员工,其中男性员工400名,采用分层抽样的方法随机抽取100名员工进行5G手机购买意向的调查,将计划在今年购买5G手机的员工称为“追光簇”,计划在明年及明年以后才购买5G手机的员工称为“观望者”调查结果发现抽取的这100名员工中属于“追光簇”的女性员工和男性员工各有20人。 属于“追光簇” 属于“观望者”合计
(理)(1)完成下列22列联表,并判断 女性员工
是否有95%的把握认为该公司员工属于“追 男性员工
光簇”与性别有关; 合计 100
(2)已知被抽取的这100名员工中,有10名是人事部的员工,这10名中有3名“追光簇
”,现从这10名员工中随机抽取3名,记被抽取的3名中属于“追光簇”的人数为随机变量X,求X的分布列及首席期望。
(文)(1)同(理)(1);
(2)已知被抽取的这100名员工中,有6名是人事部的员工,,这6名中有3名“追光簇
”,现从这6名员工中随机抽取3名,求抽取到的3名中恰有1名属于“追光簇”的概率(2020成都市高三一诊)附:= ,其中n=a+b+c+d。
P() 0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.801 5.024 6.635 7.879 10.828
4、(理)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某企业为了调查内部员工对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有99%的把握认为满意度与年龄有关?
(2)为了帮助年龄在40岁及以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1000+700x;方案乙:y= 3000,0<x5,已知这8名员工的贡献积分分别为2分,3分,6分,7分,7分,11分, 5600,,5<x10,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为 9000,x>10 ,“A类员工”,为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率。
(文)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某机关为了调查内部职员对新个税方案的满意程度是否与年龄有关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有85%的把握认为满意度与年龄有关?
(2)若已经在满意程度为“基本满意”的职员中用分层抽样的方式选取了5名职员,现从这5名职员中随机选取3名进行面谈,求面谈的职员中恰有2名年龄在40岁及以下的概率(2019成都市高三二诊)
【典例3】解答下列问题:
1、某种产品的价格x(单位:万元/吨)与需求 x 12 11 10 9 8
量y(单位:吨)之间的对应数据如表所示: y 5 6 8 10 11
(1)已知可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;
(2)请预测当该产品定价为6万元时,需求量能否超过15吨?并说明理由。
参考公式:=-,=(成都市高2021级高三零诊)
2、某旅游公司针对旅游复苏设计了一款文创产品来提高收益,该公司统计了今年以来这款文创产品定价x(单位:元)与销量y(单位:万件)的数据如下表所示:
依据表中给出的数据,判断是否可用 产品定价x(单位:元) 9 9.5 10 10.5 11
线性回归模型拟合y与x的关系,请计算相 销量y(单位:万件) 11 10 8 6 5
关系数并加以说明(计算结果精确到0.01);
建立y关于x的回归方程,预测当产品定价为8.5元时,销量可达到多少万件。
参考公式:r=,=,=-。参考数据
8.06(成都市高2020级高三三珍)
3、(理)某项目的建设过程中,发现其补贴额x(单位:百万元)与该项目的经济回报y(单位:千万元)之间存在着线性相关关系,统计数据如下表:
补贴额x(单位:百万元) 2 3 4 5 6
经济回报y(单位:千万元) 2.5 3 4 4.5 6
(1)根据上表所给的数据,求出y关于x的线性回归直线方程= x+ ;
(2)为高质量完成该项目,决定对负责该项目的7名工程师进行考核,考核结果为4人优秀,3人合格,现从这7名工程师中随机抽取3人,用X表示抽取的3人中考核优秀的人数,求随机变量X的分布列与数学期望。参考公式:=,=-。
(文)某项目的建设过程中,发现其补贴额x(单位:百万元)与该项目的经济回报y(单位:千万元)之间存在着线性相关关系,统计数据如下表:
补贴额x(单位:百万元) 2 3 4 5 6
经济回报y(单位:千万元) 2.5 3 4 4.5 6
(1)根据上表所给的数据,求出y关于x的线性回归直线方程= x+ ;
(2)请根据(1)中所得到的线性回归方程,预测当补贴额达到8百万元时,该项目的经济回报。参考公式:=,=-(成都市2019级高三一诊)
4、经验说明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高,由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高,下面给出了某林场在研究树高与胸径之间的关系时收集的某种树的数据:
编号 1 2 3 4 5 6
胸径(cm) 18.1 20.1 22.2 24.4 26.0 28.3
树高(m) 18.8 19.2 21.0 21.0 22.1 22.1
编号 7 8 9 10 11 12
胸径(cm) 29.6 32.4 33.7 35.7 38.3 40.2
树高(m) 22.4 22.6 23.0 24.3 23.9 24.7
(1)根据表绘制树高y与胸径x之间关系的散点图;
(2)分析树高y与胸径x之间的相关关系,并求y关于x的线性回归方程;
(3)预测当树的胸径为50.6cm时,数的高度约是多少(精确到0.01)(2021全国高考新高考II).
附:回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
5、某种机械设备,随着使用年限的增加,它的使用功能渐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“值”换算成费用,称之为“失效费”,其中机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.30 3.30 3.60 4.40 4.80 5.20 5.30
(1)由表中数据可知,可用线性回归模型拟合y与x的关系,请用相关关系系数加以说明(精确到0.01);
(2)求出y关于x的线性回归方程,并估算该种机械设备使用10年的失效费(2021成都市高三二诊)
线性回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
〖思考问题3〗
(1)【典例3】是概率与统计中线性回归方程综合的问题,解答这类问题需要理解古典概率,线性回归方程的基本概念;掌握求古典概率,线性回归方程的基本求法和判断两个变量是否线性相关的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;求变量线性回归方程时,需要根据统计数据和相关公式通过运算分别求出,的值,把所求的值代入式子就可得到线性回归方程;判断变量是否线性的基本方法有:①先根据数据作出变量的散点图,根据散点图进行判断;②运用相关系数的计算公式,通过运算求出相关系数的值,根据相关系数值的大小进行判断。
[练习3]解答下列问题:
1、某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,制
作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润,该公司2013年至2019年的利润y关于年份代号x的统计数据如下表(一致该公司的年利润与年份代号线性相关):
年 份 2013 2014 2015 2016 2017 2018 2019
年份代号x 1 2 3 4 5 6 7
年利润y(单位:亿元) 29 33 36 44 48 52 59
(1)求y关于x的线性回归方程,并预测该公司2020年(年份代号记为8)的年利润;
(2)(理)当统计表中某年年利润的实际值大于由(1)中线性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2013年至2020年这8年中随机抽取2年,求恰有1(1)中线年为A级利润年的概率;(文)当统计表中某年年利润的实际值大于由性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2015年至2020年这6年中随机抽取2年,求恰有1年为A级利润年的概率(2020成都市高三二诊)。
参考公式:=,=-。
2、(理)在2018年俄罗斯世界杯期间,莫斯科的部分餐厅经营了来自中国的小龙虾,这些小龙虾均标有等级代码,为得到小龙虾等级代码数值x与销售单价y之间的关系,经统计得到如下数据:(2019成都市高三一诊)
(理)(1)已知销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的线性
回归方程(系数精确到0.1);
(2)(理)若莫斯科某个餐厅打算从上表的6种等级的中国小龙虾中随机选2种进行促销,记被选中的2种等级代码数值在60以下(不含60)的数量为X,求X的分布列记数学期望。
(文)若莫斯科某个餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?
3、如图所示,是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图。
为了预测该地区2018年的环境设施投资额,建立了y与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量t的值依次为1,2,----,17)建立模型①:=-30.4
+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,----,7)建立模型②:=99+17.5t(2018全国高考新课标II卷)。
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪一个模型得到的预测值更可靠?并说明理由。
【典例4】解答下列问题:
1、某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品伸缩率,甲,乙两种工艺处理后的橡胶产品的伸缩率分别记为,(i=1,2,---,10,),试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率 545 533 551 522 575 544 541 568 596 548
伸缩率 536 527 543 530 560 533 522 550 576 536
记=-(i=1,2,---,10,),记,,------,的样本平均数为,样本方差为

求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显
著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)(2023全国高考乙卷)
2、某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);
误诊率是将未患病者判定为阳性,记为q(c),假设数据在组内平均分布,以事件发生的频率作为相应事件发生的概率。
(1)当p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c),当c[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值(2023全国高考新高考II)
3、成都作为常住人口超2000万的超大城市,注册青年志愿者人数超114万,志愿服务时长超268万小时,2022年6月,成都22个市级部门联合启动了2022年成都市青年志愿者服务项目大赛。项目大赛申报期间,共收到331个主体的416个志愿服务项目,覆盖文明实践,社区治理与邻里守望,环境保护等13大领域,已知某领域共有50支志愿队伍申报,主管部门组织专家对志愿者申报队伍进行评审打分,并将专家评分(单位:分)分成6组:[40,50),[50,60),---[90,100]得到如图所示的频率分布直方图。
(1)求图中m的值;
(2)(理)从评分不低于80分的队伍中随机选取3支队伍,该3支队伍中评分不低于90分的队伍数为X,求随机变量X的分布列和期望。
(文)已知评分在[85,100]的队伍有4支,若从评分在[80,90)的队伍中任选两支,求这两支队伍至少有一支队伍评分不低于85分的概率。
4、某建设行政主管部门对辖区内A,B,C三类工程共120个项目,进行验收评估,规定评估分数在85分及其以上的项目被确定为“验收合格”项目,未达到85分的项目被确定,“有待整改”项目,现通过分层抽样的方法获得了三类工程的12个项目,其评估分数如下:A类:88,90,86,87,79;B类:85,82,91,74,92;C类:84,90。
(1)试估算A,B,C这三类工程中每工类程项目的个数;
(2)在选取的样本中,从B类的5个工程项目中随机选取2个项目进行深度调研,求选出的2个项目中既有“验收合格”项目,又有“有待整改”项目的概率(成都市2020级高三零诊)
5、某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材
积量,随机选取了10棵这种树木,测量毎棵树的根部横截面积(单位:)和材积量(单
位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总计
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.60
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.90
并计算得=0.038,=1.6158,=0.2474。
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186,已知树木的材积量与其根部横截面积近似成正比,利用以上数据给出该林区这种树木的总材积量的估计值(2022全国高考乙卷)
附:相关系数r=,1.377。
6、“2021年全国城市节约用水宣传周”已于5月9日至15日举行,成都市围绕“贯彻新发展理念,建设节水型城市”这一主题,开展了形式多样,内容丰富的活动,进一步增强全民保护水资源,防治水污染,节约用水的意识。为了解活动开展成效,某街道办事处工作人员赴一小区调查住户的节约用水情况,随机抽取了300名业主进行节约用水调查评分,将得到的分数分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100],得到如图所示的频率分布直方图:
(1)求a的值,并估计这300名业主评分的中位数;
(2)若先用分层抽样的方法从评分在[90,95)和[95,100]的业主中抽取5人,然后再从抽出的5名业主中任意选取2人作进一步访谈,求这2人中至少有1人的评分在[95,100]的概率(成都市2019级高三零诊)
7、某中学为研究课外阅读时长对语文成绩的影响,随机调查了50名学生某阶段每人每天课外阅读的平均时长(单位:分钟)及他们的语文成绩,得到如下的统计表:
平均时长(单位:分钟)(0,20] (20,40] (40,60] (60,80]
人数 9 21 15 5
语文成绩优秀人数 3 9 10 3
(1)估计该阶段这50名学生每天课外阅读平均时长的平均数(同一组中的数据用该组区间的中点值为代表);
(2)(理)若从课外阅读平均时长在区间(0,20]和(60,80]的学生中各随机选取2名进行研究,求所选4名学生中至少有3名语文成绩优秀的学生的概率。(文)若从课外阅读平均时长在区间(60,80]的学生中随机选取3名进行研究,求所选3名学生中至少有2名语文成绩优秀的学生的概率(成都市2019级高三二诊)
8、某中学为增强学生的环保意识,举办了“爱成都,护环境”的知识竞赛活动,为了解本次知识竞赛活动参赛学生的成绩,从中抽取了n名学生的分数(得分取正整数,满分为100分,所有学生的得分都在区间[50,100]中)作为样本进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出如下的频率分布直方图,并作出下面的样本分数茎叶图(图中仅列出了得分在[50,60),[60,70)的数组)。
(1)求样本容量n和频率分布直方图中x,y的值;
(2)(理)在选取的样本中,从竞赛成绩不低于70分的三组学生中按分层抽样抽取了9名学生,再从抽取的这9名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生中恰有1名学生的分数在[70,80)中的概率。(文)在选取的样本中,从竞赛成绩不低于80分的两组学生中按分层抽样抽取了5名学生,再从抽取的这5名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生的分数在[80,90)中的概率(成都市2019级高三三珍)
9、某厂研究了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别为和,样本方差分别记为和。
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-2
,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高)(2021全国高考乙卷)。
〖思考问题4〗
(1)【典例4】是概率与统计指标综合的问题,解答这类问题需要理解古典概率,平均数,标准差,方差的基本概念;掌握求古典概率,平均数,标准差,方差的计算公式和基本求法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;求平均数,标准差,方差时,需要根据统计数据,结合相关公式通过运算就可求出相应的统计指标。
[练习4]解答下列问题:
1、(理)甲,乙,丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比
赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束。经抽签,甲,乙首先比赛,丙轮空。设每场比赛双方获胜的概率都为。
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率。
(文)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级,加工业务约定:对于A级品,B级品,C级品,厂家每件分别收取加工费90元,50元,20元,对于D级品,厂家每件要赔偿原料损失费50元,该厂有甲,乙两个分厂可承接加工业务,甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件,厂家决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表 乙分厂产品等级的频数分布表
等级 A B C D 等级 A B C D
频数 40 20 20 20 频数 28 17 34 21
(1)分别估计甲,乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲,乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?(2020全国高考新课标I)
2、某公司为加强对销售员的考核与管理,从销售部门随机抽取了2019年度某一销售小组的月均销售额,该小组各组员2019年度的月均销售额(单位:万元)分别为:3.35,3.35,3.38,
3.41,3.43,3.44,3.46,3.48,3.51,3.54,3.56,3.56,3.57,3.59,3.60,3.64,3.64,3.67,3.70,3.70(2020成都市高三三诊)。
(1)根据公司人力资源部门的要求,若月均销售额超过3.52万元的组员不低于全组人数的65%,则对该销售小组给予奖励,否则不予奖励,判断该公司是否需要对抽取的销售小组发放奖励;
(2)(理)在该销售小组中,已知月均销售额最高的5名销售员中有一名的月均销售额造假,为找出月均销售额造假的组员,现决定请专业机构对这5名销售员的月均销售额逐一进行审核,直到能确定出造假组员为止,设审核次数为X,求X的分布列及数学期望;(文)从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员,求选取的2名组员
中至少有1名月均销售额超过3.68万元的概率。
3、(理)11分制乒乓球比赛,每赢一球的1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束。甲,乙两位同学进行单打比赛,假设甲发球时,甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立,在某局双方10:10平后,甲先发球,两人又打了x个球该局比赛结束。
(1)求P(x=2);
(2)求事件“x=4且甲获胜”的概率。
(文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频率分布表。
(1)分别估计这类企业中产值增长率不低于40%的企业比例,产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到0.01)(2019全国高考新课标II)附:8.602
【典例5】解答下列问题:
1、在某地区进行流行病调查,随机调查了100名某种疾病患者的年龄,得到如下的样本数据频率分布直方图。
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值作代表);
(2)估计该地区一人患这种疾病年龄在区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%,从该地区任选一人,若此人年龄位于区间[40,50),求此人患该种疾病的概率(样本数据中的患者年龄位于个区间的频率作为患者年龄位于该区间的概率,精确到0.00
01)(2022全国高考新高考II卷)
2、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分为面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(,)(i=1,2,-----,20),其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得:=60,=1200,=80,=9000,=800。
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(,)(i=1,2,-----,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该
地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由(2020全国高考新课标II)。
附:相关系数r=,1.414.
〖思考问题5〗
(1)【典例5】是概率与统计中随机抽样综合的问题,解答这类问题需要理解古典概率,简单随机抽样,系统抽样,分层抽样的基本概念;掌握求古典概率,简单随机抽样,系统抽样,分层抽样的基本求法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;简单随机抽样,系统抽样,分层抽样各具有不同的特点,适用的范围也不一样,在具体随机抽样时,首先注意问题的特征,其次是选用恰当的方法,然后再按相应的抽样方法进行抽样。
[练习5]解答下列问题:
1、为践行“绿水青山就是金山银山”的发展理念,某城区对辖区内A,B,C三类行业共200个单位的生态环境治理成效进行了考核评估,考评分数达到80分及其以上的单位被称为“星级”环保单位,未达到80分的单位被称为“非星级”环保单位,现通过分层抽样的方法获得了这三类行业的20个单位,其考评分数如下:
A类行业: 85, 82, 77, 78, 83, 87;
B类行业: 76, 67, 80, 85, 79, 81;
C类行业: 87, 88, 76, 86, 75, 84, 90, 82。
(1)试估算着三类行业中每类行业的单位个数;
(2)若在A行业抽样的这6个单位中,随机选取3个单位进行交流发言,求选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的概率(2020成都市高三零诊)
概率和统计综合问题高考大题的类型与解法
概率和统计综合问题是近几年高考的热点问题之一,可以这样毫不夸张地说,只要是数学高考试卷,都必有一个概率和统计综合问题的12分大题。从题型上看是18或19题的12分大题,难度为中,低档题型,一般的考生都会拿到9到12分。纵观近几年高考试卷,归结起来概率和统计综合大题问题主要包括:①概率与统计中22列联表的综合问题;②概率与统计中线性回归方程的综合问题;③概率与统计指标的综合问题;④概率与简单随机抽样的综合问题;⑤概率与统计图的综合问题等几种类型。各种类型问题结构上具有一定的特征,解答方法也有一定的规律可寻。那么在实际解答概率和统计综合大题问题时,到底应该如何抓住问题的结构特征,快捷,准确地解答问题呢?下面通过典型例题的详细解析来回答这个问题。
【典例5】解答下列问题:
1、某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段
由参赛队中的一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段,由该队的另一名队员投篮3次,每次投中得5分,未投中得0分,该队的比赛成绩为第二阶段得分的总和。某参赛队由甲,乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立。(2024全国高考新高考II)
(1)若p=0.4,q=0.5,甲参加第一阶段比赛,求甲,乙所在队的比赛成绩不少于5分的概率;
(2)假设0<p<q。
①为使得甲,乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段的比赛?
②为使得甲,乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段的比赛?
【解析】
【考点】①相互独立事件概率定义与性质;②求相互独立事件概率的基本方法;③互斥事件概率定义与性质;④求互斥事件概率的基本方法;⑤随机变量概率分布定义与性质;⑥求随机变量数学期望定义与性质;⑦求随机变量分布列的基本方法;;⑧求随机变量数学期望的基本方法。
【解题思路】(1)根据相互独立事件的性质,运用求相互独立事件概率的基本方法,结合问题条件就可求出甲,乙所在队的比赛成绩不少于5分的概率;(2)①根据相互独立事件和互斥事件概率的性质,运用求相互独立事件概率和互斥事件概率的基本方法,结合问题条件分别求出甲,乙参加第一阶段比赛第使得甲,乙所在队的比赛成绩为15分的概率,就可得出结论;②根据随机变量概率分布列和数学期望的性质,运用求随机变量分布列和数学期望的基本方法,分别求出甲,乙参加第一阶段比赛关于随机变量X的分布列和数学期望,就可得出为使得甲,乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段的比赛。
【详细解答】(1)设甲,乙所在队的比赛成绩不少于5分的事件为A,p=0.4,q=0.5,甲参加第一阶段比赛,p(A)=[1-][1-]=0.7840.875=0.686;(2)①设甲参加第一阶段比赛,甲,乙所在队的比赛成绩为15分的事件为B,乙参加第一阶段比赛,甲,乙所在队的比赛成绩为15分的事件为C,0<p<q,p(B)=[1-]=-.
,p(C)=[1-]=-.,p(B)-p(C)=-.
-+.=(q-p)(+pq+)+ (p-q)[++(p-pq)(q-pq)]
=3pq(p-q)[(1-p)(1-q)-1]>0,p(B)>-p(C),若0<p<q,为使得甲,乙所在队的比赛成绩为15分的概率最大,应该由甲参加第一阶段的比赛;②若甲参加第一阶段比赛,当0<p<q时,设甲,乙所在队的比赛成绩为随机变量X,X的可能取值为0,5,10,15,
p(X=0)=[1-],p(X=5)=3q[1-],p(X=10)=3
](1-q),p(X=15)=[1-],若乙参加第一阶段比赛,当0<p<q时,设甲,乙所在队的比赛成绩为随机变量Y,Y的可能取值为0,5,10,15,p(Y=0)=[1-],p(Y=5)=3p[1-],p(Y=10)=3[1-](1-p),
p(Y=15)=[1-],随机变量X的概率分
布列分别如表所示:
X 0 5 10 15
p [1-] 3q[1-] 3](1-q) [1-]
Y 0 5 10 15
p [1-] 3p[1-] 3](1-p) [1-]
EX=0+15q[1-]+30](1-q)+15 [1-] =15 [1-](q-2++2-2+) =15q[1-],EY=0+15p[1-]+30 [1-
](1-p)+15 [1-] =15 [1-](p-2++2-2+) =15p[1-],EX-EY=15q[1-]-15p[1-]=15(p-q)pq(p+q-3)>0,E(X)>-E(Y),若0<p<q,为使得甲,乙所在队的比赛成绩的数学期望最大,应该由甲参加第一阶段的比赛。
2、(理)某省举办了一次高三年级化学模拟考试,其中甲市有10000名学生参考,根据经验,该省及各市本次模拟考试成绩(满分100分)都近似服从正态分布N(u,)。
(1)已知本次模拟考试甲市平均成绩为65分,87分以上共有228人,甲市学生A的成绩为76分,试估计学生A在甲市的大致名次;
(2)在该省本次模拟考试的参考学生中随机抽取40人,记X表示在本次考试中化学成绩在(u-3,u+3)之外的人数,求P(X≥1)的概率及X的数学期望。
参考数据:0.9011,参考公式:若XN(u,),有P(u-(文)2024年1月,某市的高二调研考试首次采用了“3+1+2”新高考模式,该模式下,计算学生个人总成绩时,“3+1”的学科均以原始分记入,再选的“2”个学科(学生在政治,地理,化学,生物中选修的2科)以赋分成绩记入,赋分成绩的具体算法是:先将该市某再选科目原始成绩按从高到低划分为A,B,C,D,E五个等级,各等级人数所占比例分别约为15%,35%,35%,13%,2%,依照转换公式,将五个等级的原始分分别转换到10086,8571,7056,5541,4030五个分数区间,并对所得分数的小数点后一位进行“四舍五入”,最后得分保留为整数的转换分成绩,并作为赋分成绩,具体等级比例和赋分区间如下表:已知该市本次高二调研考试化学科目考试成绩满分为100分。
(1)已知转换公式符合一次函数模型,若学生甲,乙在本次考试中化学成绩分别为84,78,转换分成绩为78,71,试估算该市本次化学原始成绩B等级中的最高分;
(2)现从该市本次高二调研考试的化学成绩中随机选取100名学生的原始成绩进行分析,其频率分布直方图如图所示,求出图中a的值,并用样本估计总体的方法,估计该市本次化学原始成绩B等级中的最低分。
【解析】
【考点】①正态分布定义与性质;②随机变量概率分布定义与性质;③求随机变量数学期望的基本求法;④一元一次函数定义与性质;⑥频率分布直方图定义与性质;⑦样本估计总体的基本方法。
【解题思路】(理)(1)根据正态分布的性质,结合问题条件求出的值,从而得出系数A成绩在该市的大致名次;(2)根据正态分布的性质,分别求出随机抽取一名学生在(u-3【详细解答】(理)(1)本次模拟考试成绩(满分100分)近似服从正态分布N(u,),u=65分,=0.0228,=
=0.0228,P(X≥u+2)=0.0228,u+=65+2=87,=11,76=65+11=6
5+,==0.1587,P(X≥u+)=0.1587,估计学生A在甲市的大致名次为1587名;(2)在甲市参考学生中,随机抽取1名学生,成绩在(u-3,u+3)之内的概率为P(u-30.0989,随机变量X的数学期望EX=np=400.0026=0.104。
(文)(1)设一元一次函数模型为y=kx+b,学生甲,乙在本次考试中化学成绩分别为84,78,转换分成绩为78,71,78=84k+b①,71=78k+b②,联立①②解得:k=,b=-20,转换公式为y=x-20,y=85时,x=90,估算该市本次化学原始成绩B等级中的最高分为90分;(2)设样本中该市本次化学原始成绩B等级中的最低分为x,10(0.005+0.010+0.012+0.015+a+0.033)=1,a=0.025,10(0.010+0.015+0.025)=0.5=15%+35%,x=70分,即该市本次化学原始成绩B等级中的最低分为70分。
课外阅读对于培养学生阅读兴趣,拓宽知识视野,提高阅读能力具有重要作用。3、某市为了解中学生的课外阅读情况,从该市全体中学生中随机抽取了500名学生,调查他们在寒假期间每天课外阅读平均时长t(单位:分钟)得到如表所示的频数分布表,已知所调查的学生中寒假期间每天课外阅读平均时长不超过100分钟。
时长t [0,20) [20,40) [40,60) [60,80) [80,100]
学生人数 50 100 200 125 25
估计这500名学生寒假期间每天课外阅读平均时长(同一组中的数据用该
组区间的中点值为代表);
(2)(理)用频率估计概率,从该市中学生中随机抽取2名学生参加座谈,抽到的学生寒假期间每天课外阅读平均时长在[0,20)内记0分,在[20,60)内记1分,在[60,100]内记2分,用X表示这两名学生得分之和,求X的分布列和数学期望。(文)若按照分层抽样的方法从本次调查中寒假期间每天课外阅读平均时长在[0,20)和[20,40)的两组中共抽取6人进行问卷调查,并从6人中随机选取2人进行座谈,求这2人中至少有一人寒假期间每天课外阅读平均时长在[0,20)的概率。
【解析】
【考点】①频数定义与性质;②一组数据平均数定义与性质;③求一组数据平均数的基本方法;④频率定义与性质;⑤随机变量分布列定义与性质;⑥求随机变量分布列的基本方法;
⑦随机变量数学期望定义与性质;⑧求随机变量数学期望的基本方法。
【解题思路】(1)根据频数和已知随机平均数的性质,运用求已知随机平均数的基本方法,结合问题条件就可求出这500名学生寒假期间每天课外阅读平均时长;(理)(2)根据频率,随机变量分布列和数学期望的性质,运用求随机变量分布列和数学期望的基本方法,结合问题条件就可求出X的分布列和数学期望。(文)若按照分层抽样的方法从本次调查中寒假期间每天课外阅读平均时长在[0,20)和[20,40)的两组中共抽取6人进行问卷调查,并从6人中随机选取2人进行座谈,求这2人中至少有一人寒假期间每天课外阅读平均时长在[0,20)的概率。
【详细解答】(1)==49(分钟),估计这500名学生寒假期间每天课外阅读平均时
长为=49分钟;(2)(理)用频率估计概率,随机X表示这两名学生得分之和,随机变量X的可能取值为0,1,2,3,4,p(X=0)==,p(X=1)=2 X 0 1 2 3 4
=,p(X=2)=+2=, p
p(X=3)=2=,p(X=4)==,随机变量X的分布列如表所示,EX=0+1+2+3+4=(分钟)随机变量X的数学期望为分钟。(文)设抽出这2人中至少有一人寒假期间每天课外阅读平均时长在[0,20)的事件为C,按照分层抽样的方法从本次调查中寒假期间每天课外阅读平均时长在[0,20)和[20,40)的两组中共抽取6人,寒假期间每天课外阅读平均时长在[0,20)抽出的人数为=2(人),寒假期间每天课外阅读平均时长在[20,40)抽出的人数为=4(人),令平均时长在[0,20)的2人分别为,,平均时长在[20,40)的4人分别为,,,,从6人中随机抽取2人的基本事件共有,,,,,,,,,,,,,,15个,抽出这2人中至少有一人寒假期间每天课外阅读平均时长在[0,20)的基本事件有,,,,,,,,9个,p(C)==,抽出这2人中至少有一人寒假期间每天课外阅读平均时长在[0,20)的概率为。
4、“十四五”时期,成都基于历史文化底蕴,独特资源 赋,生活城市特质和市民美好生活需要,高水平推进“三城三都”(世界文创名城,旅游名城,赛事名城和国际美食之都,音乐之都,会展之都)建设,2023年,成都大运会的成功举办让赛事名城的形象深入人心,让世界看到成都的专业,活力和对体育的热爱;2024年,相约去凤凰山体育场观看成都蓉城队的比赛已经成为成都人最时尚的生活方式之一,已知足球比赛积分规则为:球队胜一场积3分,平一场积1分,负一场积0分,成都蓉城队2024年七月还将迎来主场与A对和客场与B队的两场比赛,根据前期比赛成绩,设成都蓉城队主场与A队比赛取胜的概率为,平的概率为,负的概率为;客场与B队比赛取胜的概率为,平的概率为,负的概率为,且两场比赛结果相互独立。
求成都蓉城队七月主场与A队比赛获得积分超过客场与B队比赛获得积分的概率;
用X表示成都蓉城队七月与A队和B队比赛获得积分之和,求X的分布列与期望。
【解析】
【考点】①随机事件定义与性质;②相互独立事件定义与性质;③互斥事件定义与性质;④随机变量概率分布列定义与性质;⑤随机变量数学期望定义与性质;⑥求随机事件,相互独
立事件和互斥事件概率的基本方法;⑦求随机变量概率分布列(或数学期望)的基本方法。
【解题思路】(1)根据随机事件,相互独立事件和互斥事件的性质,运用求随机事件,相互独立事件和互斥事件概率的基本方法,结合问题条件就可求出成都蓉城队七月主场与A队比赛获得积分超过客场与B队比赛获得积分的概率;(2)根据事件事件概率分布列和数学期望的性质,运用求随机变量概率分布列(或数学期望)平面法向量的基本方法,就可求出随机变量X的概率分布列和数学期望。
【详细解答】(1)设成都蓉城队七月主场与A队比赛获得积分超过客场与B队比赛获得积分的事件为C,p(C)=++=++=,成都蓉城队七月主场与A队比赛获得积分超过客场与B队比赛获得积分的概率为;(2)随机变量X表示成都蓉城队七月与A队和B队比赛获得积分之和,随机变量X的可能取值为0,1,2,3,4,6,p(X=0)==,p(X=1)=+=,p(X=2)==,
p(X=3)=+=,p(X=4)=+=,p(X=6)==,随机变量X的概率分布列为: X 0 1 2 3 4 6
P 随机变量X的数学期望为EX=0+1+2+3+4+6=。
5、甲,乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮。无论之前投篮情况如何,甲每次投篮命中率均为0.6,乙每次投篮命中率均为0.8,由抽签确定第一次投篮的人选,第一次投篮的人是甲,乙的概率各为0.5。
(1)求第二次投篮的人是乙的概率;
(2)求第i次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且p(=1)=1-p(=0)=qi,i=1,2,---n,则E()=,记前n次(即从第一次到第n次)投篮中甲投篮的次数为Y,求E(Y)(2023全国高考新高考I)。
【解析】
【考点】①相互独立事件概率定义与性质;②求相互独立事件概率的基本方法;③互斥事件概率定义与性质;④求互斥事件概率的基本方法;⑤随机变量概率分布定义与性质;⑥求随机变量数学期望的基本方法。
【解题思路】(1)根据相互独立事件和互斥事件概率的性质,运用求相互独立事件概率和互斥事件概率的基本方法,结合问题条件就可求出第二次投篮的人是乙的概率;(2)根据相互独立事件和互斥事件概率的性质,运用求相互独立事件概率和互斥事件概率的基本方法,结合问题条件就可求出第i次投篮的人是甲的概率;(3)由(2)得到随机变量Y的概率分布列,根据随机变量概率分布列的性质,运用求随机变量数学期望的基本方法就可求出E(Y)的值。
【详细解答】(1)设第i次甲投篮命中的事件为,第i次乙投篮命中的事件为,第二次投篮的人是乙的事件为C,第二次投篮的人是乙的可能情况有两种,其一,第一次投篮的人是甲,且甲第一次投篮没有命中;其二,第一次投篮的人是乙,且乙第一次投篮命中,
p(C)=0.5(1-0.6)+0.50.8=0.2+0.4=0.6,即第二次投篮的人是乙的概率为0.6;(2)设第i次投篮的人是甲的事件为,当i=1时,p()=0.5,当i≥2时,p()=0.6p()+0.2(1-p())=0.4p()+0.2,p()-=(p()-),p()=0.5(1-0.8)+0.50.6=0.1+0.3=0.4,-=,-=,数列{(p()-}是以
为首项,为公比的等比数列,p()-=,p()=+,
即第i次投篮的人是甲的概率为+;(3)设第i次投篮的人是甲的事件为,
随机变量Y的概率分布列满足:p()=+(i=1,2,---n,),
E(Y)===+=(1-)+(n)。
6、甲,乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0
分,没有平局,三个项目比赛结束后,总得分高的学校获得冠军,已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立。
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与数学期望(2022全国高考甲卷理)
【解析】
【考点】①相互独立事件定义与性质;②互斥事件定义与性质;③求相互独立事件概率的基本方法;④求互斥事件概率的基本方法;⑤随机变量概率分布列定义与性质;⑥随机变量数学期望定义与性质;⑦求随机变量概率分布列和数学期望的基本方法。
【解题思路】(1)根据相互独立事件和互斥事件的性质,运用求相互独立事件和互斥事件概率的基本方法,结合问题条件就可求出甲学校获得冠军的概率;(2)根据随机变量概率分布列和数学期望的性质,运用求随机变量概率分布列和数学期望的基本方法,结合问题条件就可求出随机变量X的分布列与数学期望。
【详细解答】(1)设甲学校获得冠军的事件为A,甲学校获得冠军要么比赛的三个项目都获胜,要么是比赛的三个项目中两个获胜,甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8, p(A)=0.50.40.8+0.50.4(1-0.8)+ 0.5(1-0.4)0.8+(1-0.5)0.40.8=0.16+0.04
+0.24+0.16=0.6;(2)由题意可知,随机变量X的可能取值为0,10,20,30,p(X=0)=0.50.40.8=0.16,p(X=10)=0.50.4(1-0.8)+ 0.5(1-0.4)0.8+(1-0.5)0.40.8=0.44,
p(X=20)=0.5(1-0.4)(1-0.8)+(1- 0.5)(1-0.4)0.8+(1-0.5)0.4(1-0.8)=0.06+0.24
+0.04=0.34,p(X=30)=(1-0.5)(1-0.4)(1-0.8)=0.06,随机变量X的概率分布列如表所示,随机变量X的数学期望为E(X) X 0 10 20 30
=00.16+100.44+200.34+300.06=0 p 0.16 0.44 0.34 0.06
+4.4+6.8+1.8=13(分)。
7、某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确,则从另一类问题中在随机抽取一个问题回答,无论回答正确与否,该同学比赛结束。A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分。已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关(2021全国高考新高考I卷)。
(1)若小明先回答A类问题,记X为小明累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应该选择先回答哪类问题?并说明理由。
【解析】
【考点】①古典概率的定义与性质;②求古典概率的基本求法;③求随机变量概率分布列的基本方法;④求随机变量数学期望的基本求法。
【解题思路】(1)根据古典概率的性质和求古典概率的基本方法,结合问题条件分别求出X=0分,X=20分,X=100分的概率,运用求随机变量分布列的基本方法就可求出小明先回答A类问题,记X为小明累计得分时,X的分布列;(2)根据求随机变量概率分布列的基本方法,结合问题条件求出频率的求法求出小明先回答B类问题,记Y为小明累计得分时,Y的分布列,运用求随机变量数学期望的基本方法,分别求出小明先回答A类问题,随机变量X的数学期望和小明先回答B类问题,随机变量Y的数学期望,比较两个变量的数学期望就可得出结论。
【详细解答】(1)随机变量X的可能取值为0分, 随机变量X 0 20 100
20分,100分,p(X=0)=1-0.8=0.2,p(X=20) 概率p 0.2 0.32 0.48
=0.8 (1-0.6)=0.32,p(X=100)=0.8 0.6=0.48,小明先回答A类问题,记X为小明累计得分时,X的分布列如表所示;(2)小明先回答B类问题,记Y为小明累计得分,随机变量Y的可能取值为0分,80分,100分,p 随机变量Y 0 80 100
(Y=0)=1-0.6=0.4,p(Y=80)=0.6(1-0.8) 概率p 0.4 0.12 0.48
=0.12,p(Y=100)=0.60.8=0.48,小明先回答B类问题,记Y为小明累计得分时,Y的分布列如表所示, EX=0+0.3220+1000.48=54.4(分),EY=0+0.1280+1000.48=57.6(分),57.6>54.4,为使累计得分的期望最大,小明应该选择先回答B类问题。
8、《营造法式》是中国北宋时期官方颁布的一部建筑设计与施工的书籍,标志着我国古代建筑技术和工艺发展到了较高水平,中国近代建筑之父梁恩成用现代语言和制图方法对该书进行了注释,著有《(营造法式)注释》,为了让建筑类学生了解古建筑设计与构造的原理,某建筑大学为大三和大四的学生开设了一门选修课程《营造法式及其注释》,为检测学生学习效果,要求所有选修该门课程的学生完成“应用营造法式独立制作一件古建筑模型”的作业,已知选修该门课程的大三与大四学生的人数之比为3:2,现用分层抽样的方法从所有作业中随机抽取100份(每位学生均上交一份作业),并评出成绩,得到如下频率分布表:
(理)(1)求x,y的值,并估计这100份作业中大三学生作业的平均成绩(同一组中的数据用该组区间的中点值为代表);
(2)在这100份作业的样本中,从成绩在[50,80)的大四学生作业中随机抽取2份,记抽取的这2份作业中成绩在[60,70)的份数为X,求X的分布列与数学期望。
成绩(单位:分) [50,60) [60,70) [70,80) [80,90) [90,100)
频数(不分年级) 4 x 20 38 30
频数(大三年级) 3 6 15 y 12
(文)(1)求y的值,若以频率作为概率,从选修该门课程的大四学生中随机选取1名,试估计该学生的作业成绩在[60,80)的概率;
(2)估计这100份作业中大三学生作业的平均成绩(同一组中的数据用该组区间的中点值为代表)(2021成都市高三三诊)
【解析】
【考点】①频数的定义与性质;②加权平均数计算公式及运用;③随机变量概率分布列的定义与性质;④求随机变量概率分布列的基本方法;⑤随机变量数学期望的定义与性质;⑥求随机变量数学期望的基本方法;⑦随机事件概率大于与性质;⑧求随机事件概率的基本方法。
【解题思路】(理)(1)根据频数的性质,结合问题条件分别得到关于x,y的方程,求解方程求出x,y的值,根据求加权平均数公式和基本方法就可求出大三学生作业的平均成绩;(2)运用求随机变量概率分布列的基本方法求出随机变量X的分布列,根据分布列利用求随机变量数学期望的基本方法通过运算就可求出随机变量X的数学期望。(文)(1)根据频数的性质,结合问题条件分别得到关于y的方程,求解方程求出y的值,运用随机事件概率的性质和求随机事件概率的基本方法,就可求出该学生的作业成绩在[60,80)的概率;(2)根据统计表,运用加权平均数计算公式就可求出这100份作业中大三学生作业的平均成绩。
【详细解答】(理)(1)4+x+20+38+30=100,x=100-(4+20+38+30)=8,3+6+15+y+12
=100=60,y=60-(3+6+15+12)=24,
=81(分),这100份作业中大三学生作业的平均成绩为81分;(2)由题意可知,X的取值可能为0,1,2,这100名学生中成绩在[50,80)的大四学生人数为1+2+5=8(人),成绩在[60,70)的大四学生人数为8-6=2(人), X 0 1 2
p(X=0)= ==,p(X=1)= p
= = ,p(X=2)= = = ,随机变量X的概率分布列如表所示,随机变量X的数学期望为 0+1+2=。(文)(1)设从选修该门课程的大四学生中随机选取1名,该学生的作业成绩在[60,80)的事件为A3+6+15+y+12=100=60,
y=60-(3+6+15+12)=24,4+x+20+38+30=100,x=100-(4+20+38+30)=8,这100
名学生中大四学生的人数为100=40(人),大四学生中作业成绩在[60,80)的人数为
(8+20)-(6+15)=7(人),p(A)= ,即从选修该门课程的大四学生中随机选取1
名,估计该学生的作业成绩在[60,80)的概率为;
(2)==81(分),这100份作业中大三学生作业的平均成绩为81分。
〖思考问题1〗
(1)【典例1】是统计,随机变量分布列和数学期望综合的问题,解答这类问题需要理解随机事件概率,统计图,随机变量分布列和数学我的基本概念;掌握求随机事件概率,随机
变量概率分布列与数学期望的基本求法和统计表(或统计图)的性质与基本作法;
(2)求某事件的概率,根据统计表(或统计图),结合随机事件概率的计算公式通过运算就可求出某个事件的概率;运用统计表(或统计图)解答相关问题时,应该根据问题条件确定统计表(或统计图)属于哪一种类型,结合这种统计表(或统计图)的性质实施问题的解答;求随机变量概率分布列(或数学期望)的基本方法是:①确定随机变量的可能取值;②分别求出各随机变量值的概率;③得到随机变量概率分布列,从而求出随机变量的数学期望。
[练习1]解答下列问题:
1、2019年12月,《生活垃圾分类标志》新标准发布并正式实施,为进一步普及生活垃圾分类知识,了解居民生活垃圾分类情况,某社区开展了一次关于垃圾分类的问卷调查活动,并对随机抽取的1000人的年龄进行了统计,得到如下的各年龄段频数分布表和各年龄段人数频率分布直方图:
(1)请补全各年龄段人数频率分布直方图,并求出各年龄段频数分布表中m,n的值;
(2)现从年龄在,[30,40)段中采用分层抽样的方法选取5名代表参加垃圾分类知识交流活动,应社区要求,从被选中的这5名代表中任意选2名作交流发言,求选取的2名发言者中恰有1名年龄段在[35,40)段中的概率(2021成都市高三零诊)。
(答案:(1)补全各年龄段人数频率分布直方图如图所示,n=100,m=200;(2)从被选中的这5名代表中任意选2名作交流发言,选取的2名发言者中恰有1名年龄段在[35,40)段中的概率为。)
2、2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮,某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:分钟)将学生分成六个组:[0,20),[20,40),[40,60),[60,80),[80,100),[100,120],经统计得到了如图所示的频率分布直方图(2019成都市高三零诊)。
(1)求频率分布直方图中a的值;并估计该校文学院的学生每天诵读诗词的时间的平均数;
(2)若两个同学诵读诗词的时间x,y满足|x-y|>60,则这两个同学组成一个“Tean”,已知从每天诵读诗词的时间小于20分钟和大于或等于80分钟的所有学生中用分层抽样的方法抽取了5人,现从这5人中随机选取2人,求选取的两人能组成一个“Tean”的概率。
(答案:(1)a=0.0025,该校文学院的学生每天诵读诗词的时间的平均数为64(分钟);(2)从这5人中随机选取2人,选取的两人能组成一个“Tean”的概率。)
3、(理)某部门为了解企业在生产过程中的用水量情况,对每 7 3 1
天的用水量作了记录,得到了大量该企业的日用水量的统计数据, 8 3 5 6 7 8 9
从这些统计数据中随机抽取12天的数据作为样本,得到如图所 9 5 7 8 9
示的茎叶图(单位:吨),若用水量不低于95吨,则称这一天
的用水量超标。
(1)从这12天的数据中随机抽取3个,求至多有1天用水量超标的概率;
(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X为未来3天中用水量超标的天数,求X的分布列和数学期望。
(文)某部门为了解企业在生产过程中的用水量 日用水量 [70,80)[80,90)[90,100]
情况,对每天的用水量作了记录,得到了该企业(单位:吨)
的日用水量的统计数据,从这些统计数据中随机 频数 3 6 m
抽取12天的用水量的数据作为样本,得到的统 频率 n 0.5 p
计结果如右表:(2018成都市高三一诊)
(1)求m,n,p的值;
(2)已知样本中日用水量在[80,90)内的这六个数据分别为83,85,86,87,88,89,从六个数据中随机抽取两个,求抽取的两个数据中至少有一个大于86的概率。
(答案:(理)(1)即从这12天的数据中随机抽取3个,至多有1天用水量超标的概率为;(2)随机变量X的分布列如表所示, X 0 1 2 3
随机变量X的数学期望为1天。 P
(文)(1)m=3,n=0.25,p=0.25;(2)从六个数据中随机抽取两个,抽取的两个数据中至少有一个大于86的概率为。)
(理)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶
6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完。根据往年销售经验,每
天需求量与当天最高气温(单位:)有关,如果气温不低于25,需求量为500瓶;如果
气温位于区间[20,25),需求量为300瓶;如果气温低于20,需求量为200瓶。为了确定6月份的订购计划,统计了前三年六月份各天的最高气温数据,得到下面的频率分布表:
最高气温 [10,15)[15,20)[20,25)[25,30)[30,35)[35,40)
天数 2 16 36 25 7 4
以最高气温位于各区间的频率代替最高气温位于该区间的概率(2017全国高考新课标III卷)。
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,y的数学期望达到最大值?
(文)(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出y的所有可能值,并估计y大于零的概率。
(答案:(理)(1)随机变量X的分布列如表所示, X 200 300 500
当n=300时,y的数学期望达到最大值520元。 p
(文)(1)六月份这种酸奶一天的需求量不超过300的概率为;(2)估计y大于零的概率为。)
【典例2】解答下列问题:
1、某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲,乙两个车间的产品中随
机抽取了150件进行检验,数据如下:
优级品 合格品 不合格品 总计 优级品 非优级品
甲车间 26 24 0 50 甲车间 26 24
乙车间 70 28 2 100 乙车间 70 30
总计 96 52 2 150
(1)填写如表列联表,能否有95%的把握认为甲,乙两车间产品的优级品率存在差异?
能否有99%的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品优级品率p=0.5,设为升级改造后抽取的n件产品的优
级品率,如果>p+1.65,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?
参考数据:12.247,=,(2024全国高考甲卷)
p(≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
【解析】
【考点】①独立性检验定义与性质;②22列联表定义与性质;③独立性检验的基本方法;④随机事件概率定义与性质;⑤求随机事件概率的基本方法。
【解题思路】(1)根据独立性检验和22列联表的性质,运用独立性检验的基本方法,结合问题条件得出22列联表如表所示,从而求出能否有95%的把握认为甲,乙两车间产品的优级品率存在差异?能否有99%的把握认为甲,乙

展开更多......

收起↑

资源预览