【高考专题】概率和统计综合问题高考大题的类型与解法 二轮专题练习(含解析)

资源下载
  1. 二一教育资源

【高考专题】概率和统计综合问题高考大题的类型与解法 二轮专题练习(含解析)

资源简介

中小学教育资源及组卷应用平台
概率和统计综合问题高考大题的类型与解法
概率和统计综合问题是近几年高考的热点问题之一,可以这样毫不夸张地说,只要是数学高考试卷,都必有一个概率和统计综合问题的12分大题。从题型上看是18(或19)题的12分大题,难度系数为中,低档,一般考生都会拿到9到12分。纵观近几年高考试卷,归结起来概率和统计综合大题问题主要包括:①概率与统计中22列联表的综合问题;②概率与统计中线性回归方程的综合问题;③概率与统计指标的综合问题;④概率与简单随机抽样的综合问题;⑤概率与统计图的综合问题等几种类型。各种类型问题结构上具有一定的特征,解答方法也有一定的规律可寻。那么在实际解答概率和统计综合大题问题时,到底应该如何抓住问题的结构特征,快捷,准确地解答问题呢?下面通过典型例题的详细解析来回答这个问题。
【典例1】解答下列问题:
1、(理)为探究某箹物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加箹物)和实验组(加箹物)。
(1)设其中两只小鼠中,对照组小鼠数目为X,求X的分布列和数学期望;
(2)测得40只小鼠体重如下(单位:g),(已按从小到大排好)。
对照组:17.3,18.4,20..1,20.4,21..3,23..2,24.6, 24.8, 25.0, 25.4, 26.1, 26.3,26.4, 26.5, 26.8, 27.0, 27.4, 27.5, 27.6, 28.3;
实验组:3.4, 6.6, 6.8, 6.9, 7.8, 8.2, 9.4, 10.0, 10.4, 11.2, 14.4, 17.3,
19.2, 20.2, 23.6, 23.8, 24.3, 25.1, 25.2, 26.0。
①求40只小鼠体重的中位数m,并完成下面22列联表:
②根据22列联表,能否有95%的把握认为箹物对小鼠生长有抑制作用。
对照组 6 14 20 k 0.10 0.05 0.01
实验组 14 6 20 p(≥k) 2.716 3.541 6.615
合计 20 20 40
(文)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在搞浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g),试验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2,18.8,20..2,21.3,22..5,23..2,25.8, 26.5, 27.5, 30.1, 32.6, 34.3,34.8, 35.6, 35.6, 35.8, 36.2, 37.3, 40.5, 43.2;
试验组的小白鼠体重的增加量从小到大排序为:7.8, 9.2, 11.4, 12.4, 13.2, 15.5, 16.5, 18.0, 18.8, 19.2, 19.8, 20.2,21.6, 22.8, 23.6, 23.9, 25.1, 28.2, 32.3, 36.5。
(1)计算试验组的样本平均数;
(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本在小于m与不小于m的数据的个数,完成如下表22列联表:
②根据①中的22列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?(2023全国高考甲卷)
对照组 6 14 20 k 0.100 0.050 0.010
实验组 14 6 20 p(≥k) 2.706 3.841 6.635
合计 20 20 40
2、某中学为了丰富学生的课余生活,欲利用每周一下午的自主活动时间,面向本校高二学生开设“厨艺奥秘”,“金景栽培”,“家庭摄影”,“名画鉴赏”四门选修课,由学生自主申报,每人只能报一门,也可以不报。该校高二有两种班型-文科班和理科班(各由2个班),据调查这四个中有100人报名参加了本次选修课,报名情况统计如下表:
厨艺奥秘 金景栽培家庭摄影名画鉴赏 课程类型 课 程 合计
文科1班 11 5 14 6 劳育课程 美育课程
文科2班 12 7 11 4 文科班 35 35 70
理科1班 3 1 9 3 理科班 10 20 20
理科2班 5 1 6 2 合计 45 55 100
若把“厨艺奥秘”,“金景栽培”统称为“劳育课程”,把“家庭摄影”,“名画鉴赏”统称为“美育课程”,请根据所给数据完成以上22列联表;
根据(1)列联表所填数据,判断是否有99%的把握认为课程的选择与班型有关。附:
= (成都市高2020级高三二诊)
p( >)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.01 0.005
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879
3、甲,乙两城之间的长途客车均由A和B两家公司运载, 准点班次数 未准点班次数
为了解这两家公司长途客车的运行情况,随机调查了甲 A 240 20
、乙两城之间的500个班次,得到如表所示的列联表: B 210 30
(1)根据上表,分别估计两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
(2022全国高考甲卷文)
4、一医疗团队为研究某地的一种地方性疾病与 不够良好 良好
当地居民的卫生习惯(卫生习惯分为良好和不够 病例组 40 60
良好两类)的关系,在已患该疾病的病例中随机 对照组 10 90
调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),
得到如表所示的数据:
能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件
“选到的人患有该疾病”, 与的比值是卫生习惯不够良好对患该疾病风险程度的一项指标,记该指标为R。
①证明:R=.;
②利用该调查数据,给出p(A|B),的估计值,并利用①的结果给出R的估计值(2022全国高考新高考I卷)
附:,。
5、甲,乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床,乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?(2021全国高考甲卷)
6、以网络公司为某贫困山区培养了100名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富,该公司将这100名“乡土直播员”中每天直播时间不少于5小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”,根据实际评选结果得到了下面22列联表: 网红乡土直播员 乡土直播达人 合计
(1)根据列联表判断是否有95%的把握认 男 10 40 50
为“网红乡土直播员”与性别有关? 女 20 30 50
(2)(理)在“网红乡土直播员”按分层抽样 合计 30 70 100
方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”中男性人数为,求的分布列和期望。
(文)在“网红乡土直播员”按分层抽样方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”,求这俩人中恰有一男一女的概率(2021成都市高三一诊)
附:
(其中n=a+b+c+d)
7、某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天)
锻炼人次 (0,200] (200,400] (400,600]
空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”,若某天的空气质量等级为3或4,则称这天“空气质量不好”。根据所给数据,完成下面22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?(2020全国高考新课标III)
人次400 人次>400
空气质量好
空气质量不好
附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
8、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和S浓度(单位:ug/),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率;
S [0,50] (50,150] (150,475]
PM2.5
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(2)根据所给数据,完成下面22列联表:
S [0,150] (150,475]
PM2.5
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与S浓度有关?(2020全国高考新高考I)
赋:附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
9、某公司有1000名员工,其中男性员工400名,采用分层抽样的方法随机抽取100名员工进行5G手机购买意向的调查,将计划在今年购买5G手机的员工称为“追光簇”,计划在明年及明年以后才购买5G手机的员工称为“观望者”调查结果发现抽取的这100名员工中属于“追光簇”的女性员工和男性员工各有20人。 属于“追光簇” 属于“观望者”合计
(理)(1)完成下列22列联表,并判断 女性员工
是否有95%的把握认为该公司员工属于“追 男性员工
光簇”与性别有关; 合计 100
(2)已知被抽取的这100名员工中,有10名是人事部的员工,这10名中有3名“追光簇
”,现从这10名员工中随机抽取3名,记被抽取的3名中属于“追光簇”的人数为随机变量X,求X的分布列及首席期望。
(文)(1)同(理)(1);
(2)已知被抽取的这100名员工中,有6名是人事部的员工,,这6名中有3名“追光簇
”,现从这6名员工中随机抽取3名,求抽取到的3名中恰有1名属于“追光簇”的概率(2020成都市高三一诊)附:= ,其中n=a+b+c+d。
P() 0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.801 5.024 6.635 7.879 10.828
10、(理)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某企业为了调查内部员工对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有99%的把握认为满意度与年龄有关?
(2)为了帮助年龄在40岁及以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1000+700x;方案乙:y= 3000,0<x5,已知这8名员工的贡献积分分别为2分,3分,6分,7分,7分,11分, 5600,,5<x10,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为 9000,x>10 ,“A类员工”,为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率。
(文)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某机关为了调查内部职员对新个税方案的满意程度是否与年龄有关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有85%的把握认为满意度与年龄有关?
(2)若已经在满意程度为“基本满意”的职员中用分层抽样的方式选取了5名职员,现从这5名职员中随机选取3名进行面谈,求面谈的职员中恰有2名年龄在40岁及以下的概率(2019成都市高三二诊)
〖思考问题1〗
(1)【典例1】是概率与统计中独立性检验综合的问题,解答这类问题需要理解古典概率,22列联表,两个变量相关的基本概念;掌握古典概率,22列联表,两个变量相关系数的求法和判断两个变量是否相关的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;22列联表依据统计表可以直接列出,求相关系数时,需要根据22列联表和相关公式通过运算就可求出,判定两个变量是否相关的基本方法是:①作出变量的散点图,根据变量散点图进行判断;②运用公式求出相关系数的值,根据相关系数的值进行判断。
【典例2】解答下列问题:
1、某种产品的价格x(单位:万元/吨)与需求 x 12 11 10 9 8
量y(单位:吨)之间的对应数据如表所示: y 5 6 8 10 11
(1)已知可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;
(2)请预测当该产品定价为6万元时,需求量能否超过15吨?并说明理由。
参考公式:=-,=(成都市高2021级高三零诊)
2、某旅游公司针对旅游复苏设计了一款文创产品来提高收益,该公司统计了今年以来这款文创产品定价x(单位:元)与销量y(单位:万件)的数据如下表所示:
依据表中给出的数据,判断是否可用 产品定价x(单位:元) 9 9.5 10 10.5 11
线性回归模型拟合y与x的关系,请计算相 销量y(单位:万件) 11 10 8 6 5
关系数并加以说明(计算结果精确到0.01);
建立y关于x的回归方程,预测当产品定价为8.5元时,销量可达到多少万件。
参考公式:r=,=,=-。参考数据
8.06(成都市高2020级高三三珍)
3、(理)某项目的建设过程中,发现其补贴额x(单位:百万元)与该项目的经济回报y(单位:千万元)之间存在着线性相关关系,统计数据如下表:
补贴额x(单位:百万元) 2 3 4 5 6
经济回报y(单位:千万元) 2.5 3 4 4.5 6
(1)根据上表所给的数据,求出y关于x的线性回归直线方程= x+ ;
(2)为高质量完成该项目,决定对负责该项目的7名工程师进行考核,考核结果为4人优秀,3人合格,现从这7名工程师中随机抽取3人,用X表示抽取的3人中考核优秀的人数,求随机变量X的分布列与数学期望。参考公式:=,=-。
(文)某项目的建设过程中,发现其补贴额x(单位:百万元)与该项目的经济回报y(单位:千万元)之间存在着线性相关关系,统计数据如下表:
补贴额x(单位:百万元) 2 3 4 5 6
经济回报y(单位:千万元) 2.5 3 4 4.5 6
(1)根据上表所给的数据,求出y关于x的线性回归直线方程= x+ ;
(2)请根据(1)中所得到的线性回归方程,预测当补贴额达到8百万元时,该项目的经济回报。参考公式:=,=-(成都市2019级高三一诊)
4、经验说明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高,由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高,下面给出了某林场在研究树高与胸径之间的关系时收集的某种树的数据:
编号 1 2 3 4 5 6
胸径(cm) 18.1 20.1 22.2 24.4 26.0 28.3
树高(m) 18.8 19.2 21.0 21.0 22.1 22.1
编号 7 8 9 10 11 12
胸径(cm) 29.6 32.4 33.7 35.7 38.3 40.2
树高(m) 22.4 22.6 23.0 24.3 23.9 24.7
(1)根据表绘制树高y与胸径x之间关系的散点图;
(2)分析树高y与胸径x之间的相关关系,并求y关于x的线性回归方程;
(3)预测当树的胸径为50.6cm时,数的高度约是多少(精确到0.01)(2021全国高考新高考II).
附:回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
5、某种机械设备,随着使用年限的增加,它的使用功能渐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“值”换算成费用,称之为“失效费”,其中机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.30 3.30 3.60 4.40 4.80 5.20 5.30
(1)由表中数据可知,可用线性回归模型拟合y与x的关系,请用相关关系系数加以说明(精确到0.01);
(2)求出y关于x的线性回归方程,并估算该种机械设备使用10年的失效费(2021成都市高三二诊)
线性回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
6、某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,制
作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润,该公司2013年至2019年的利润y关于年份代号x的统计数据如下表(一致该公司的年利润与年份代号线性相关):
年 份 2013 2014 2015 2016 2017 2018 2019
年份代号x 1 2 3 4 5 6 7
年利润y(单位:亿元) 29 33 36 44 48 52 59
(1)求y关于x的线性回归方程,并预测该公司2020年(年份代号记为8)的年利润;
(2)(理)当统计表中某年年利润的实际值大于由(1)中线性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2013年至2020年这8年中随机抽取2年,求恰有1(1)中线年为A级利润年的概率;(文)当统计表中某年年利润的实际值大于由性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2015年至2020年这6年中随机抽取2年,求恰有1年为A级利润年的概率(2020成都市高三二诊)。
参考公式:=,=-。
7、(理)在2018年俄罗斯世界杯期间,莫斯科的部分餐厅经营了来自中国的小龙虾,这些小龙虾均标有等级代码,为得到小龙虾等级代码数值x与销售单价y之间的关系,经统计得到如下数据:(2019成都市高三一诊)
(理)(1)已知销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的线性
回归方程(系数精确到0.1);
(2)(理)若莫斯科某个餐厅打算从上表的6种等级的中国小龙虾中随机选2种进行促销,记被选中的2种等级代码数值在60以下(不含60)的数量为X,求X的分布列记数学期望。
(文)若莫斯科某个餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?
8、如图所示,是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图。
为了预测该地区2018年的环境设施投资额,建立了y与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量t的值依次为1,2,----,17)建立模型①:=-30.4
+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,----,7)建立模型②:=99+17.5t(2018全国高考新课标II卷)。
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪一个模型得到的预测值更可靠?并说明理由。
〖思考问题2〗
(1)【典例2】是概率与统计中线性回归方程综合的问题,解答这类问题需要理解古典概率,线性回归方程的基本概念;掌握求古典概率,线性回归方程的基本求法和判断两个变量是否线性相关的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;求变量线性回归方程时,需要根据统计数据和相关公式通过运算分别求出,的值,把所求的值代入式子就可得到线性回归方程;判断变量是否线性的基本方法有:①先根据数据作出变量的散点图,根据散点图进行判断;②运用相关系数的计算公式,通过运算求出相关系数的值,根据相关系数值的大小进行判断。
【典例3】解答下列问题:
1、某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品伸缩率,甲,乙两种工艺处理后的橡胶产品的伸缩率分别记为,(i=1,2,---,10,),试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率 545 533 551 522 575 544 541 568 596 548
伸缩率 536 527 543 530 560 533 522 550 576 536
记=-(i=1,2,---,10,),记,,------,的样本平均数为,样本方差为

求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显
著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)(2023全国高考乙卷)
2、某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);
误诊率是将未患病者判定为阳性,记为q(c),假设数据在组内平均分布,以事件发生的频率作为相应事件发生的概率。
(1)当p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c),当c[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值(2023全国高考新高考II)
3、成都作为常住人口超2000万的超大城市,注册青年志愿者人数超114万,志愿服务时长超268万小时,2022年6月,成都22个市级部门联合启动了2022年成都市青年志愿者服务项目大赛。项目大赛申报期间,共收到331个主体的416个志愿服务项目,覆盖文明实践,社区治理与邻里守望,环境保护等13大领域,已知某领域共有50支志愿队伍申报,主管部门组织专家对志愿者申报队伍进行评审打分,并将专家评分(单位:分)分成6组:[40,50),[50,60),---[90,100]得到如图所示的频率分布直方图。
(1)求图中m的值;
(2)(理)从评分不低于80分的队伍中随机选取3支队伍,该3支队伍中评分不低于90分的队伍数为X,求随机变量X的分布列和期望。
(文)已知评分在[85,100]的队伍有4支,若从评分在[80,90)的队伍中任选两支,求这两支队伍至少有一支队伍评分不低于85分的概率。
4、某建设行政主管部门对辖区内A,B,C三类工程共120个项目,进行验收评估,规定评估分数在85分及其以上的项目被确定为“验收合格”项目,未达到85分的项目被确定,“有待整改”项目,现通过分层抽样的方法获得了三类工程的12个项目,其评估分数如下:A类:88,90,86,87,79;B类:85,82,91,74,92;C类:84,90。
(1)试估算A,B,C这三类工程中每工类程项目的个数;
(2)在选取的样本中,从B类的5个工程项目中随机选取2个项目进行深度调研,求选出的2个项目中既有“验收合格”项目,又有“有待整改”项目的概率(成都市2020级高三零诊)
5、某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量毎棵树的根部横截面积(单位:)和材积量(单
位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总计
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.60
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.90
并计算得=0.038,=1.6158,=0.2474。
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186,已知树木的材积量与其根部横截面积近似成正比,利用以上数据给出该林区这种树木的总材积量的估计值(2022全国高考乙卷)
附:相关系数r=,1.377。
6、“2021年全国城市节约用水宣传周”已于5月9日至15日举行,成都市围绕“贯彻新发展理念,建设节水型城市”这一主题,开展了形式多样,内容丰富的活动,进一步增强全民保护水资源,防治水污染,节约用水的意识。为了解活动开展成效,某街道办事处工作人员赴一小区调查住户的节约用水情况,随机抽取了300名业主进行节约用水调查评分,将得到的分数分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100],得到如图所示的频率分布直方图:
(1)求a的值,并估计这300名业主评分的中位数;
(2)若先用分层抽样的方法从评分在[90,95)和[95,100]的业主中抽取5人,然后再从抽出的5名业主中任意选取2人作进一步访谈,求这2人中至少有1人的评分在[95,100]的概率(成都市2019级高三零诊)
7、某中学为研究课外阅读时长对语文成绩的影响,随机调查了50名学生某阶段每人每天课外阅读的平均时长(单位:分钟)及他们的语文成绩,得到如下的统计表:
平均时长(单位:分钟)(0,20] (20,40] (40,60] (60,80]
人数 9 21 15 5
语文成绩优秀人数 3 9 10 3
(1)估计该阶段这50名学生每天课外阅读平均时长的平均数(同一组中的数据用该组区间的中点值为代表);
(2)(理)若从课外阅读平均时长在区间(0,20]和(60,80]的学生中各随机选取2名进行研究,求所选4名学生中至少有3名语文成绩优秀的学生的概率。(文)若从课外阅读平均时长在区间(60,80]的学生中随机选取3名进行研究,求所选3名学生中至少有2名语文成绩优秀的学生的概率(成都市2019级高三二诊)
8、某中学为增强学生的环保意识,举办了“爱成都,护环境”的知识竞赛活动,为了解本次知识竞赛活动参赛学生的成绩,从中抽取了n名学生的分数(得分取正整数,满分为100分,所有学生的得分都在区间[50,100]中)作为样本进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出如下的频率分布直方图,并作出下面的样本分数茎叶图(图中仅列出了得分在[50,60),[60,70)的数组)。
(1)求样本容量n和频率分布直方图中x,y的值;
(2)(理)在选取的样本中,从竞赛成绩不低于70分的三组学生中按分层抽样抽取了9名学生,再从抽取的这9名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生中恰有1名学生的分数在[70,80)中的概率。(文)在选取的样本中,从竞赛成绩不低于80分的两组学生中按分层抽样抽取了5名学生,再从抽取的这5名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生的分数在[80,90)中的概率(成都市2019级高三三珍)
9、某厂研究了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别为和,样本方差分别记为和。
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-2
,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高)(2021全国高考乙卷)。
10、(理)甲,乙,丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束。
经抽签,甲,乙首先比赛,丙轮空。设每场比赛双方获胜的概率都为。
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率。
(文)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级,加工业务约定:对于A级品,B级品,C级品,厂家每件分别收取加工费90元,50元,20元,对于D级品,厂家每件要赔偿原料损失费50元,该厂有甲,乙两个分厂可承接加工业务,甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件,厂家决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表 乙分厂产品等级的频数分布表
等级 A B C D 等级 A B C D
频数 40 20 20 20 频数 28 17 34 21
(1)分别估计甲,乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲,乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?(2020全国高考新课标I)
11、某公司为加强对销售员的考核与管理,从销售部门随机抽取了2019年度某一销售小组的月均销售额,该小组各组员2019年度的月均销售额(单位:万元)分别为:3.35,3.35,3.38,
3.41,3.43,3.44,3.46,3.48,3.51,3.54,3.56,3.56,3.57,3.59,3.60,3.64,3.64,3.67,3.70,3.70(2020成都市高三三诊)。
(1)根据公司人力资源部门的要求,若月均销售额超过3.52万元的组员不低于全组人数的65%,则对该销售小组给予奖励,否则不予奖励,判断该公司是否需要对抽取的销售小组发放奖励;
(2)(理)在该销售小组中,已知月均销售额最高的5名销售员中有一名的月均销售额造假,为找出月均销售额造假的组员,现决定请专业机构对这5名销售员的月均销售额逐一进行审核,直到能确定出造假组员为止,设审核次数为X,求X的分布列及数学期望;(文)从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员,求选取的2名组员
中至少有1名月均销售额超过3.68万元的概率。
12、(理)11分制乒乓球比赛,每赢一球的1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束。甲,乙两位同学进行单打比赛,假设甲发球时,甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立,在某局双方10:10平后,甲先发球,两人又打了x个球该局比赛结束。
(1)求P(x=2);
(2)求事件“x=4且甲获胜”的概率。
(文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频率分布表。
(1)分别估计这类企业中产值增长率不低于40%的企业比例,产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到0.01)(2019全国高考新课标II)附:8.602
〖思考问题3〗
(1)【典例3】是概率与统计指标综合的问题,解答这类问题需要理解古典概率,平均数,标准差,方差的基本概念;掌握求古典概率,平均数,标准差,方差的计算公式和基本求法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;求平均数,标准差,方差时,需要根据统计数据,结合相关公式通过运算就可求出相应的统计指标。
【典例4】解答下列问题:
1、在某地区进行流行病调查,随机调查了100名某种疾病患者的年龄,得到如下的样本数据频率分布直方图。
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值作代表);
(2)估计该地区一人患这种疾病年龄在区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%,从该地区任选一人,若此人年龄位于区间[40,50),求此人患该种疾病的概率(样本数据中的患者年龄位于个区间的频率作为患者年龄位于该区间的概率,精确到0.00
01)(2022全国高考新高考II卷)
2、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分为面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(,)(i=1,2,-----,20),其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得:=60,=1200,=80,=9000,=800。
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(,)(i=1,2,-----,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该
地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由(2020全国高考新课标II)。
附:相关系数r=,1.414.
3、为践行“绿水青山就是金山银山”的发展理念,某城区对辖区内A,B,C三类行业共200个单位的生态环境治理成效进行了考核评估,考评分数达到80分及其以上的单位被称为“星级”环保单位,未达到80分的单位被称为“非星级”环保单位,现通过分层抽样的方法获得了这三类行业的20个单位,其考评分数如下:
A类行业: 85, 82, 77, 78, 83, 87;
B类行业: 76, 67, 80, 85, 79, 81;
C类行业: 87, 88, 76, 86, 75, 84, 90, 82。
(1)试估算着三类行业中每类行业的单位个数;
(2)若在A行业抽样的这6个单位中,随机选取3个单位进行交流发言,求选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的概率(2020成都市高三零诊)
〖思考问题4〗
(1)【典例4】是概率与统计中随机抽样综合的问题,解答这类问题需要理解古典概率,简单随机抽样,系统抽样,分层抽样的基本概念;掌握求古典概率,简单随机抽样,系统抽样,分层抽样的基本求法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;简单随机抽样,系统抽样,分层抽样各具有不同的特点,适用的范围也不一样,在具体随机抽样时,首先注意问题的特征,其次是选用恰当的方法,然后再按相应的抽样方法进行抽样。
【典例5】解答下列问题:
1、甲,乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮。无论之前投篮情况如何,甲每次投篮命中率均为0.6,乙每次投篮命中率均为0.8,由抽签确定第一次投篮的人选,第一次投篮的人是甲,乙的概率各为0.5。
(1)求第二次投篮的人是乙的概率;
(2)求第i次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且p(=1)=1-p(=0)=qi,i=1,2,---n,则E()=,记前n次(即从第一次到第n次)投篮中甲投篮的次数为Y,求E(Y)(2023全国高考新高考I)。
2、甲,乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局,三个项目比赛结束后,总得分高的学校获得冠军,已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立。
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与数学期望(2022全国高考甲卷理)
3、某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确,则从另一类问题中在随机抽取一个问题回答,无论回答正确与否,该同学比赛结束。A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分。已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关(2021全国高考新高考I卷)。
(1)若小明先回答A类问题,记X为小明累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应该选择先回答哪类问题?并说明理由。
4、《营造法式》是中国北宋时期官方颁布的一部建筑设计与施工的书籍,标志着我国古代建筑技术和工艺发展到了较高水平,中国近代建筑之父梁恩成用现代语言和制图方法对该书进行了注释,著有《(营造法式)注释》,为了让建筑类学生了解古建筑设计与构造的原理,某建筑大学为大三和大四的学生开设了一门选修课程《营造法式及其注释》,为检测学生学习效果,要求所有选修该门课程的学生完成“应用营造法式独立制作一件古建筑模型”的作业,已知选修该门课程的大三与大四学生的人数之比为3:2,现用分层抽样的方法从所有作业中随机抽取100份(每位学生均上交一份作业),并评出成绩,得到如下频率分布表:
(理)(1)求x,y的值,并估计这100份作业中大三学生作业的平均成绩(同一组中的数据用该组区间的中点值为代表);
在这100份作业的样本中,从成绩在[50,80)的大四学生作业中随机抽取2份,记抽取的这2份作业中成绩在[60,70)的份数为X,求X的分布列与数学期望。
成绩(单位:分) [50,60) [60,70) [70,80) [80,90) [90,100)
频数(不分年级) 4 x 20 38 30
频数(大三年级) 3 6 15 y 12
(文)(1)求y的值,若以频率作为概率,从选修该门课程的大四学生中随机选取1名,试估计该学生的作业成绩在[60,80)的概率;
(2)估计这100份作业中大三学生作业的平均成绩(同一组中的数据用该组区间的中点值为代表)(2021成都市高三三诊)
5、2019年12月,《生活垃圾分类标志》新标准发布并正式实施,为进一步普及生活垃圾分类知识,了解居民生活垃圾分类情况,某社区开展了一次关于垃圾分类的问卷调查活动,并对随机抽取的1000人的年龄进行了统计,得到如下的各年龄段频数分布表和各年龄段人数频率分布直方图:
(1)请补全各年龄段人数频率分布直方图,并求出各年龄段频数分布表中m,n的值;
(2)现从年龄在,[30,40)段中采用分层抽样的方法选取5名代表参加垃圾分类知识交流活动,应社区要求,从被选中的这5名代表中任意选2名作交流发言,求选取的2名发言者中恰有1名年龄段在[35,40)段中的概率(2021成都市高三零诊)。
6、2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮,某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:分钟)将学生分成六个组:[0,20),[20,40),[40,60),[60,80),[80,100),[100,120],经统计得到了如图所示的频率分布直方图(2019成都市高三零诊)。
(1)求频率分布直方图中a的值;并估计该校文学院的学生每天诵读诗词的时间的平均数;
(2)若两个同学诵读诗词的时间x,y满足|x-y|>60,则这两个同学组成一个“Tean”,已知从每天诵读诗词的时间小于20分钟和大于或等于80分钟的所有学生中用分层抽样的方法抽取了5人,现从这5人中随机选取2人,求选取的两人能组成一个“Tean”的概率。
7、(理)某部门为了解企业在生产过程中的用水量情况,对每 7 3 1
天的用水量作了记录,得到了大量该企业的日用水量的统计数据, 8 3 5 6 7 8 9
从这些统计数据中随机抽取12天的数据作为样本,得到如图所 9 5 7 8 9
示的茎叶图(单位:吨),若用水量不低于95吨,则称这一天
的用水量超标。
(1)从这12天的数据中随机抽取3个,求至多有1天用水量超标的概率;
(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X为未来3天中用水量超标的天数,求X的分布列和数学期望。
(文)某部门为了解企业在生产过程中的用水量 日用水量 [70,80)[80,90)[90,100]
情况,对每天的用水量作了记录,得到了该企业(单位:吨)
的日用水量的统计数据,从这些统计数据中随机 频数 3 6 m
抽取12天的用水量的数据作为样本,得到的统 频率 n 0.5 p
计结果如右表:(2018成都市高三一诊)
(1)求m,n,p的值;
(2)已知样本中日用水量在[80,90)内的这六个数据分别为83,85,86,87,88,89,从六个数据中随机抽取两个,求抽取的两个数据中至少有一个大于86的概率。
8、(理)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完。根据往年销售经验,每天需求量与当天最高气温(单位:)有关,如果气温不低于25,需求量为500瓶;如果气温位于区间[20,25),需求量为300瓶;如果气温低于20,需求量为200瓶。为了确定6月份的订购计划,统计了前三年六月份各天的最高气温数据,得到下面的频率分布表:
最高气温 [10,15)[15,20)[20,25)[25,30)[30,35)[35,40)
天数 2 16 36 25 7 4
以最高气温位于各区间的频率代替最高气温位于该区间的概率(2017全国高考新课标III卷)。
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,y的数学期望达到最大值?
(文)(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出y的所有可能值,并估计y大于零的概率。
〖思考问题5〗
(1)【典例5】是概率与统计图,随机变量分布列综合的问题,解答这类问题需要理解古典概率,统计图,随机变量分布列的基本概念;掌握求古典概率,随机变量概率分布列的基本求法和各种统计图的性质与基本作法;
(2)求某个事件的概率,根据统计图,结合古典概率的计算公式通过运算就可求出某个事件的概率;运用统计图解答相关问题时,应该根据问题条件确定统计图属于哪一种类型,结合这种统计图的性质实施问题的解答;求随机变量概率分布列的基本方法是:①恰当随机变量的可能取值;②分别求出各随机变量值的概率;③得到随机变量概率分布列。
概率和统计综合问题高考大题的类型与解法
概率和统计综合问题是近几年高考的热点问题之一,可以这样毫不夸张地说,只要是数学高考试卷,都必有一个概率和统计综合问题的12分大题。从题型上看是18或19题的12分大题,难度为中,低档题型,一般的考生都会拿到9到12分。纵观近几年高考试卷,归结起来概率和统计综合大题问题主要包括:①概率与统计中22列联表的综合问题;②概率与统计中线性回归方程的综合问题;③概率与统计指标的综合问题;④概率与简单随机抽样的综合问题;⑤概率与统计图的综合问题等几种类型。各种类型问题结构上具有一定的特征,解答方法也有一定的规律可寻。那么在实际解答概率和统计综合大题问题时,到底应该如何抓住问题的结构特征,快捷,准确地解答问题呢?下面通过典型例题的详细解析来回答这个问题。
【典例1】解答下列问题:
1、(理)为探究某箹物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加箹物)和实验组(加箹物)。
(1)设其中两只小鼠中,对照组小鼠数目为X,求X的分布列和数学期望;
(2)测得40只小鼠体重如下(单位:g),(已按从小到大排好)。
对照组:17.3,18.4,20..1,20.4,21..3,23..2,24.6, 24.8, 25.0, 25.4, 26.1, 26.3,26.4, 26.5, 26.8, 27.0, 27.4, 27.5, 27.6, 28.3;
实验组:3.4, 6.6, 6.8, 6.9, 7.8, 8.2, 9.4, 10.0, 10.4, 11.2, 14.4, 17.3,
19.2, 20.2, 23.6, 23.8, 24.3, 25.1, 25.2, 26.0。
①求40只小鼠体重的中位数m,并完成下面22列联表:
②根据22列联表,能否有95%的把握认为箹物对小鼠生长有抑制作用。
对照组 6 14 20 k 0.10 0.05 0.01
实验组 14 6 20 p(≥k) 2.716 3.541 6.615
合计 20 20 40
(文)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在搞浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g),试验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2,18.8,20..2,21.3,22..5,23..2,25.8, 26.5, 27.5, 30.1, 32.6, 34.3,34.8, 35.6, 35.6, 35.8, 36.2, 37.3, 40.5, 43.2;
试验组的小白鼠体重的增加量从小到大排序为:7.8, 9.2, 11.4, 12.4, 13.2, 15.5, 16.5, 18.0, 18.8, 19.2, 19.8, 20.2,21.6, 22.8, 23.6, 23.9, 25.1, 28.2, 32.3, 36.5。
(1)计算试验组的样本平均数;
(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本在小于m与不小于m的数据的个数,完成如下表22列联表:
②根据①中的22列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?(2023全国高考甲卷)
对照组 6 14 20 k 0.100 0.050 0.010
实验组 14 6 20 p(≥k) 2.706 3.841 6.635
合计 20 20 40
【解析】
【考点】①随机事件定义与性质;②求随机事件概率的基本方法;③随机变量概率分布列定义与性质;④随机变量数学期望定义与性质;⑤求随机变量概率分布列和数学期望的基本方法;⑥数据平均数定义与性质;⑦数据中位数定义与性质;⑧独立性检验定义与性质;⑨求数据平均数和中位数的基本方法;⑩独立性检验的基本方法。
【解题思路】(理)(1)根据随机事件,随机变量概率分布列和数学期望的性质,运用求随机事件概率,随机变量概率分布列和数学期望的基本方法,结合问题条件就可求出X的分布列和数学期望;(2)根据中位数和独立性检验的性质,运用求数据中位数和独立性检验的基本方法,结合问题条件就可求出据22列联表和确定能否有95%的把握认为箹物对小鼠生长有抑制作用。(文)(1)根据数据平均数的性质,运用求数据平均数的基本方法,结合问题条件就可求出试验组的样本平均数;(2)根据中位数和独立性检验的性质,运用求数据中位数和独立性检验的基本方法,结合问题条件就可求出据22列联表和确定能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异。
【详细解答】(理)(1)随机变量X的取值可能为0,1, X 0 1 2
2,p(X=0)===,p(X=1)= p
==,p(X=2)===随机变量X的分布列如表所示,随机变量X的数学期望为0+1+2=1;(2)①根据数据可知40只小鼠体重的中位数m==23.4(g),得到22列联表如表所示;②由22列联表可得K==6.400>3.541,有95%的把握认为箹物对小鼠生长有抑制作用。(文)(1)=
=19.8,试验组的样本平均数为19.8;(2)①根据数据可知40只小白鼠体重增加量的中位数m==23.4(g),得到22列联表如表所示;②由22列联表可得==6.400>3.841,有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异。
2、某中学为了丰富学生的课余生活,欲利用每周一下午的自主活动时间,面向本校高二学生开设“厨艺奥秘”,“金景栽培”,“家庭摄影”,“名画鉴赏”四门选修课,由学生自主申报,每人只能报一门,也可以不报。该校高二有两种班型-文科班和理科班(各由2个班),据调查这四个中有100人报名参加了本次选修课,报名情况统计如下表:
厨艺奥秘 金景栽培家庭摄影名画鉴赏 课程类型 课 程 合计
文科1班 11 5 14 6 劳育课程 美育课程
文科2班 12 7 11 4 文科班 35 35 70
理科1班 3 1 9 3 理科班 10 20 20
理科2班 5 1 6 2 合计 45 55 100
若把“厨艺奥秘”,“金景栽培”统称为“劳育课程”,把“家庭摄影”,“名画鉴赏”统称为“美育课程”,请根据所给数据完成以上22列联表;
根据(1)列联表所填数据,判断是否有99%的把握认为课程的选择与班型有关。附:
= (成都市高2020级高三二诊)
p( >)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.01 0.005
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879
【解析】
【考点】①22列联表定义与性质;②独立性检验定义与性质;③根据独立性检验判断随机变量是否有关的基本求法。
【解题思路】(1)根据22列联表的性质,结合问题条件就可完成22列联表;(2)根据独立性检验的性质,运用公式通过运用,就可判断是否有99%的把握认为课程的选择与班型有关。
【详细解答】(1)根据给定数据,完成以上22列联表如表所示;(2)
==2.357<6.635,没有99%的把握认为“劳育课程”,“美育课程”的选择与班型有关。
3、甲,乙两城之间的长途客车均由A和B两家公司运载, 准点班次数 未准点班次数
为了解这两家公司长途客车的运行情况,随机调查了甲 A 240 20
、乙两城之间的500个班次,得到如表所示的列联表: B 210 30
(1)根据上表,分别估计两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
(2022全国高考甲卷文)
【解析】
【考点】①古典概率定义与性质;②求古典概率的基本方法;③统计估计的基本方法;④2乘2列联表定义与性质;⑤独立性检验定义与性质;⑥独立性检验的基本方法。
【解题思路】(1)根据古典概率的性质,运用求古典概率和统计估计的基本方法,结合问题条件就可分别估计出两家公司甲、乙两城之间的长途客车准点的概率;(2)根据2乘2列联表和独立性检验的性质,运用独立性检验的基本方法,就可得出能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关。
【详细解答】(1)设A公司两城之间的长途客车准点的事件为C,B公司两城之间的长途客车准点的事件为D, p(C)= = ,p(D)= = ,估计A公司甲、乙两城之间的长途客车准点的概率为,估计B公司甲、乙两城之间的长途客车准点的概率为;
(2)===3.205>2.706,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关。
4、一医疗团队为研究某地的一种地方性疾病与 不够良好 良好
当地居民的卫生习惯(卫生习惯分为良好和不够 病例组 40 60
良好两类)的关系,在已患该疾病的病例中随机 对照组 10 90
调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),
得到如表所示的数据:
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”, 与的比值是卫生习惯不够良好对患该疾病风险程度的一项指标,记该指标为R。
①证明:R=.;
②利用该调查数据,给出p(A|B),的估计值,并利用①的结果给出R的估计值(2022全国高考新高考I卷)
附:,。
【解析】
【考点】①2乘2列联表定义与性质;②独立性检验定义与性质;③独立性检验的基本方法;④条件概率定义与性质;⑤求条件概率的基本方法。
【解题思路】(1)根据2乘2列联表和独立性检验的性质,运用独立性检验的基本方法,结合问题条件求出的值,就可判断能否有99%的把握认为患该疾病群体与,未患该疾病群体的卫生习惯有差异;(2)①根据条件概率的性质,运用求条件概率的分别求出与就可证明结论;②基本方法,就可得出能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关。
【详细解答】(1)===24>10.8
28,有99%的把握认为患该疾病群体与,未患该疾病群体的卫生习惯有差异;(2)①证明:
R=.= = =
= = . , R=.;②p(A|B)==,==,=1- p(A|B)=1-=,==,
R=.= . =6。
5、甲,乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床,乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?(2021全国高考甲卷)
【解析】
【考点】①统计表的定义与性质;②频率的定义与性质;③求频率的基本方法;④22列联表的定义与性质;⑤两个变量相关的定义与判定的基本方法。
【解题思路】(1)根据统计表,频率的性质和求频率的基本方法,结合问题条件就可分别求出甲机床,乙机床生产的产品中一级品的频率;(2)根据22列联表,结合公式求出的值,依据计算结果和附表就可得出结论。
【详细解答】(1)由统计表可知,甲机床生产200件产品中有一级品150件,甲机床生产的产品中一级品的频率为==0.75,由统计表可知,,乙机床生产200件产品中有一级品120件,乙机床生产的产品中一级品的频率为==0.60,甲机床,乙机床生产的产品中一级品的频率分别是0.75,0.60;(2)=
===10.257>6.635,
有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异。
6、以网络公司为某贫困山区培养了100名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富,该公司将这100名“乡土直播员”中每天直播时间不少于5小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”,根据实际评选结果得到了下面22列联表: 网红乡土直播员 乡土直播达人 合计
(1)根据列联表判断是否有95%的把握认 男 10 40 50
为“网红乡土直播员”与性别有关? 女 20 30 50
(2)(理)在“网红乡土直播员”按分层抽样 合计 30 70 100
方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”中男性人数为,求的分布列和期望。
(文)在“网红乡土直播员”按分层抽样方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”,求这俩人中恰有一男一女的概率(2021成都市高三一诊)
附:(其中n=a+b+c+d)
【解析】
【考点】①22列联表的定义与性质;②两个变量相关的定义与判定的基本方法;③分层抽样的定义与性质;④分层抽样的基本方法;⑤随机变量概率分布列定义与性质;⑥求随机变量概率分布列的基本方法;⑦随机变量数学期望的定义与性质;⑧求随机变量数学期望的基本方法;⑨古典概率的定义与性质;⑩求古典概率的基本方法。
【解题思路】(1)根据22列联表和公式,结合问题条件求出的值就可判断是否有95%的把握为“网红乡土直播员”与性别有关;(2)(理)根据随机变量概率分布列的性质和求随机变量概率分布列的基本方法,结合问题条件就可得到随机变量的分布列,运用随机变量数学期望的性质和求随机变量数学期望的基本方法就可求出随机变量的数学期望。(文)根据古典概率性质和求古典概率基本方法就可求出选取俩人中恰有一男一女的概率。
【详细解答】(1)==4.762>3.841,
有95%的把握认为“网红乡土直播员”与性别有关;(2)(理)抽取的男性人数为:
6=2(人),女性人数为:6=4(人),随机变量的可能取值为:0,1,2,p(=0)===,p(=1)= 0 1 2
= = ,p(=2)= p
= =,随机变量 的分布列如表所示,E=0+1+2=。(文)设被选中的2名“乡土直播推广大使”中恰有一男一女的事件为A,抽取的男性人数为:6=2(人),女性人数为:6=4(人),令抽取的2名男性分别为,,抽取的4名女性分别为,,,,从这6人随机抽取2人的基本事件有:,,,,,,,,,,,,,,共15个,从这6人随机抽取2人,恰有一男一女的基本事件有:,,,,,,
,共8个,p(A)=,即被选中的2名“乡土直播推广大使”中恰有一
男一女的概率为。
7、某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人
次,整理数据得到下表(单位:天)
锻炼人次 (0,200] (200,400] (400,600]
空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”,若某天的空气质量等级为3或4,则称这天“空气质量不好”。根据所给数据,完成下面22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?(2020全国高考新课标III)
人次400 人次>400
空气质量好
空气质量不好
附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
【解析】
【考点】①统计表的定义与性质;②统计估计的基本方法;③求古典概率的基本方法;④求组距数列平均数的基本方法;⑤22列联表的定义与性质;⑥两个变量相关的定义与判定的基本方法。
【解题思路】(1)运用统计表,统计估计的基本方法和求古典概率的基本方法分别求出该市一天的空气质量等级为1,2,3,4的概率就可得出结果;(2)根据统计表和求组距数列平均数的基本方法求出一天中到该公园锻炼的平均人次就可得出结果;(3)利用统计表填写22列联表,由22列联表,结合公式求出的值,依据计算结果和附表就可得出结论。
【详细解答】(1)设样本中该市一天的空气质量等级为1,2,3,4的事件分别为A,B,C,
D,P(A)==0.43,P(B)= =0.27,P(C)= =0.21,
P(D)= =0.09,估计该市一天的空气质量等级为1,2,3,4的概率分别是0.43,0.27,0.21,0.09;(2)样本中一天中到该公园锻炼的平均人次为:
=350,一天中到该公园锻炼的平均人次的估计值为350;
(3)根据统计表得到22列联表如下表所示:
人次400 人次>400
空气质量好 33 37
空气质量不好 22 8
==5.820>3.841,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关。
8、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和S浓度(单位:ug/),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率;
S [0,50] (50,150] (150,475]
PM2.5
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(2)根据所给数据,完成下面22列联表:
S [0,150] (150,475]
PM2.5
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与S浓度有关?(2020全国高考新高考I)
赋:附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
【解析】
【考点】①统计表定义与性质;②统计估计基本方法;③求古典概率基本方法;④求组距数列平均数基本方法;⑤22列联表定义与性质;⑥两个变量相关的定义与判定的基本方法。
【解题思路】(1)运用统计表,统计估计的基本方法和求古典概率的基本方法求出事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率就可得出结果;(2)根据统计表填写22列联表就可得到22列联表;(3)由22列联表,结合公式求出的值,利用计算的结果和附表就可得出结论。
【详细解答】(1)设“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”
的事件为A,P(A)==0.64,估计事件“该市一天空气中PM2.5浓度不
超过75,且S浓度不超过150”的概率为0.64;(2)22列联表如表所示:
PM2.5 S [0,150] (150,475]
[0,75] 64 16
(75,115] 10 10
(3)==7.488>6.635,有99%的把握认为该市一天空气中PM2.5浓度与S浓度有关。
9、某公司有1000名员工,其中男性员工400名,采用分层抽样的方法随机抽取100名员工进行5G手机购买意向的调查,将计划在今年购买5G手机的员工称为“追光簇”,计划在明年及明年以后才购买5G手机的员工称为“观望者”调查结果发现抽取的这100名员工中属于“追光簇”的女性员工和男性员工各有20人。 属于“追光簇” 属于“观望者”合计
(理)(1)完成下列22列联表,并判断 女性员工
是否有95%的把握认为该公司员工属于“追 男性员工
光簇”与性别有关; 合计 100
(2)已知被抽取的这100名员工中,有10名是人事部的员工,这10名中有3名“追光簇
”,现从这10名员工中随机抽取3名,记被抽取的3名中属于“追光簇”的人数为随机变量X,求X的分布列及首席期望。
(文)(1)同(理)(1);
(2)已知被抽取的这100名员工中,有6名是人事部的员工,,这6名中有3名“追光簇
”,现从这6名员工中随机抽取3名,求抽取到的3名中恰有1名属于“追光簇”的概率(2020成都市高三一诊)附:= ,其中n=a+b+c+d。
P() 0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.801 5.024 6.635 7.879 10.828
【解析】
【考点】①统计表的定义与性质;②22列联表的定义与性质;③两个变量相关的定义与判定的基本方法;④求随机变量分布列的基本方法;⑤数学期望的定义与基本求法;⑥求古典概率的基本方法。
【解题思路】(1)运用统计表填写22列联表,就可得到22列联表,根据22列联表,结合公式求出的值,依据计算结果和附表就可得出结论;(2)(理)根据求古典概率的基本方法分别求出随机变量为0,1,2,3的概率,从而得到随机变量的分布列,利用求数学期望的基本方法就可求出随机变量的数学期望;(文)运用古典概率的基本求法,就可求出从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的概率。
【详细解答】(理)(1)男员工应该抽取的人数=100 =40(人),女员工应该抽取的人数=100=60(人),“追光簇”的男,女员工各 有20人,男员工的“观望者”=40-20=20(人),女员工的“观望老”=60-20=40(人),22列联表如下表所示:
属于“追光簇” 属于“观望老” 合计
女性员工 20 4 0 60
男性员工 20 20 40
合计 40 60 100
==2.778<3.841,没有95%的把握认为该公司的“追光簇”与性别有关;(2)随机变 X 0 1 2 3
量X的取值可能 0,1,2,3, P(X=0)= P
==,P(X=1)= = = ,P(X=2)= = = ,
P(X=3)= = ,随机变量X的分布为列如表所=0+1+2
+3==。
(文)(1)男员工应该抽取的人数=100=40(人),女员工应该抽取的人数=100 =60(人),“追光簇”的男,女员工各有20人,男员工的“观望者”=40-20=20(人),女员工的“观望者”=60-20=40(人),22列联表如表所示:
属于“追光簇” 属于“观望者” 合计
女性员工 20 40 60
男性员工 20 20 40
合计 40 60 100
==2.778<3.841,没有95%的把握认为
该公司的“追光簇”与性别有关;(2)设从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的事件为C,6名人事部员工中,3名追光簇分别为,,,3名观望者分别为,,,从6名人事部的员工中随机抽取3名的基本事件有:,, , ,, ,,, ,,,,,,,,, ,,共20个,从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的事件有:, ,,,,,, ,共9个,从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的概率P(C)==。
10、(理)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某企业为了调查内部员工对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有99%的把握认为满意度与年龄有关?
(2)为了帮助年龄在40岁及以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1000+700x;方案乙:y= 3000,0<x5,已知这8名员工的贡献积分分别为2分,3分,
5600,5<x10, 9000,x>10 ,6分,7分,7分,11分,
12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为 “A类员工”, 为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率。
(文)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某机关为了调查内部职员对新个税方案的满意程度是否与年龄有关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有85%的把握认为满意度与年龄有关?
(2)若已经在满意程度为“基本满意”的职员中用分层抽样的方式选取了5名职员,现从这5名职员中随机选取3名进行面谈,求面谈的职员中恰有2名年龄在40岁及以下的概率(2019成都市高三二诊)
【解析】
【考点】①22列联表的定义与性质;②相关系数的计算公式与求法;③判断两组数据是否相关的基本方法;④函数值的定义与求法;⑤古典概率的定义与求法;⑥分层抽样的定义与求各层抽样数的基本方法。
【解题思路】(1)运用22列联表,结合公式求出的值,根据所求的值利用参数数据得出结论;(2)(理)根据方案甲,乙通过运算确定“A类员工”的人数,再依据随机事件概率的计算公式求出随机事件的概率;(文)根据分层抽样各层抽样数的计算公式通过运算确定“基本满意”在40岁以下和40岁以上的人数,再利用古典概率的计算公式求出事件的概率。
【详细解答】(理)(1)==11.429>
6.635,有99%的把握认为该企业员工对新个税方案的满意程度与年龄有关系;
(2)①当积分为2分时,方案甲获得的补贴=1000+7002=2400(元),方案乙获得的补贴=3000(元),2400<3000,积分是2分的员工不属于“A类员工”;② 当积分为3分时,方案甲获得的补贴=1000+7003=3100(元),方案乙获得的补贴=3000(元),3100>3000,积分是3分的员工属于“A类员工”;③ 当积分为6分时,方案甲获得的补贴=1000+
7006=5200(元),方案乙获得的补贴=5600(元),5200<5600,积分是6分的员工不属于“A类员工”;④ 当积分为7分时,方案甲获得的补贴=1000+7007=5900(元),方案乙获得的补贴=5600(元),5900>3000,积分是7分的员工属于“A类员工”;⑤ 当积分为11分时,方案甲获得的补贴=1000+70011=8700(元),方案乙获得的补贴=9000(元),8700<9000,积分是11分的员工不属于“A类员工”;⑥ 当积分为12分时,方案甲获得的补贴=1000+70012=9400(元),方案乙获得的补贴=9000(元),9400>9000,积分是12分的员工属于“A类员工”; 综上所述,该企业8名需要解决实际困难的员
工中属于“A类员工”的有5人,设从8名员工中随机抽取4名,恰好抽到3名“A类员工”
的事件为B,从8名员工中随机抽取4名的基本事件===70,从8名员工中随机抽取4名恰好有3名“A类员工”的基本事件=.=
=310=30,P(B)==,即从8名员工中随机抽取4名,恰好抽到3名“A类员工”
的概率为。
(文)(1)==11.429>2.072,有85%的把握认为该企业员工对新个税方案的满意程度与年龄有关系;
(2)40岁以下抽取的人数=5=3(人),40岁以上抽取的人数=5=2(人),设从5名员工中随机抽取3名面谈,恰好抽到2名年龄在40岁以下的事件为C,三名40岁以下的员工分别为,,,二名40岁以上的员工分别为,,从
5名员工中随机抽取3名的基本事件有:,,,,
, , ,,,共10个,从5名员工中随机抽取3名恰好有2名年龄在40岁以下的基本事件有:,,,
, , 共6个,P(C)==,即从5名员工中随机抽取3
名进行面谈,恰好抽到2名年龄在40岁以下的概率为。
〖思考问题1〗
(1)【典例1】是概率与统计中独立性检验综合的问题,解答这类问题需要理解古典概率,22列联表,两个变量相关的基本概念;掌握古典概率,22列联表,两个变量相关系数的求法和判断两个变量是否相关的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个
事件的概率;22列联表依据统计表可以直接列出,求相关系数时,需要根据22列联表和相关公式通过运算就可求出,判定两个变量是否相关的基本方法是:①作出变量的散点图,根据变量散点图进行判断;②运用公式求出相关系数的值,根据相关系数的值进行判断。
【典例2】解答下列问题:
1、某种产品的价格x(单位:万元/吨)与需求 x 12 11 10 9 8
量y(单位:吨)之间的对应数据如表所示: y 5 6 8 10 11
(1)已知可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;
(2)请预测当该产品定价为6万元时,需求量能否超过15吨?并说明理由。
参考公式:=-,=(成都市高2021级高三零诊)
【解析】
【考点】①两个随机变量线性相关定义与性质;②线性回归方程定义与性质;③求线性回归方程的基本方法;④回归预测的基本方法。
【解题思路】(1)根据两个随机变量线性相关和线性回归方程的性质,运用求线性回归方法的基本方法,结合问题条件就可求出y关于x的线性回归方程;(2)根据回归预测的基本方法,预测当该产品定价6万元时,需求量的值,从而就可得出结论。
【详细解答】(1) ==10,==8,
===-1.6,:=-
=8-(-1.6)10=24,y关于x的线性回归方程为=-1.6x+24;(2)当x=6时,为=-1.66
+24=-9.6+24=14.4<15,预测当产品定价为6万元时,需求量不能超过15吨。
2、某旅游公司针对旅游复苏设计了一款文创产品来提高收益,该公司统计了今年以来这款文创产品定价x(单位:元)与销量y(单位:万件)的数据如下表所示:
依据表中给出的数据,判断是否可用 产品定价x(单位:元) 9 9.5 10 10.5 11
线性回归模型拟合y与x的关系,请计算相 销量y(单位:万件) 11 10 8 6 5
关系数并加以说明(计算结果精确到0.01);
建立y关于x的回归方程,预测当产品定价为8.5元时,销量可达到多少万件。
参考公式:r=,=,=-。参考数据
8.06(成都市高2020级高三三珍)
【解析】
【考点】①随机变量相关系数定义与性质;②求随机变量相关系数的基本方法;③线性回归方程定义与性质;④建立线性回归方程的基本方法;⑤统计预测的基本方法。
【解题思路】(1)根据随机变量相关系数的性质,运用求随机变量相关系数的基本方法,结合问题条件求出销量y与产品定价x的相关系数就可作出判断;(2)根据线性回归方程的性质,运用求线性回归方程的基本方法,求出,的值,从而建立y关于x的回归方程,利用统计预测的基本方法就可预测当产品定价为8.5元时的销量。
【详细解答】(1)==10,==8,
r==-0.99,能够用线性回归模型拟合y与x的关系;(2)===-3.2,=-=8-(-3.2)10=40,y关于x的回归方程为=-3.2x+40,x=8.5时=-3.28.5+40=12.8,当产品定价为8.5元时,预测销量可达到12.8万件。
3、(理)某项目的建设过程中,发现其补贴额x(单位:百万元)与该项目的经济回报y(单位:千万元)之间存在着线性相关关系,统计数据如下表:
补贴额x(单位:百万元) 2 3 4 5 6
经济回报y(单位:千万元) 2.5 3 4 4.5 6
(1)根据上表所给的数据,求出y关于x的线性回归直线方程= x+ ;
(2)为高质量完成该项目,决定对负责该项目的7名工程师进行考核,考核结果为4人优秀,3人合格,现从这7名工程师中随机抽取3人,用X表示抽取的3人中考核优秀的人数,求随机变量X的分布列与数学期望。参考公式:=,=-。
(文)某项目的建设过程中,发现其补贴额x(单位:百万元)与该项目的经济回报y(单位:千万元)之间存在着线性相关关系,统计数据如下表:
补贴额x(单位:百万元) 2 3 4 5 6
经济回报y(单位:千万元) 2.5 3 4 4.5 6
(1)根据上表所给的数据,求出y关于x的线性回归直线方程= x+ ;
(2)请根据(1)中所得到的线性回归方程,预测当补贴额达到8百万元时,该项目的经济回报。参考公式:=,=-(成都市2019级高三一诊)
【解析】
【考点】①两个变量线性相关定义与性质;②线性回归方程定义与性质;③求两个变量线性回归方程的基本方法;④随机变量分布列,数学期望定义与性质;⑤求随机变量分布列,数学期望的基本方法;⑥运用线性回归方程,进行预测的基本方法。
【解题思路】(理)(1)根据两个变量线性相关和线性回归方程的性质,运用求线性回归方程的基本方法就可求出y关于x的线性回归直线方程;(2)根据随机变量分布列,数学期望的性质,运用求随机变量分布列,数学期望的基本方法就可求出随机变量X的分布列与数学期望。(文)(1)根据两个变量线性相关和线性回归方程的性质,运用求线性回归方程的基本方法就可求出y关于x的线性回归直线方程;(2)根据运用线性回归方程,进行预测的基本方法就可预测出当补贴额达到8百万元时,该项目的经济回报。
【详细解答】(理)(1)根据表中数据得: = =4,=
=4,
====0.85,=
-=4-0.854=0.6, y关于x的线性回归直线方程为:=0.85x+0.6;(2)随机变量X的可能取值为:0,1,2,3, p(X=0)= = ,p(X=1) = = = ,
p(X=2) == = ,p(X=3) X 0 1 2 3
= = ,随机变量X的分布列 p
如表所示,随机变量X的数学期望为EX=0+1+2+3==。
(文)(1)根据表中数据得: = =4,= =4,====0.85,=
-=4-0.854=0.6, y关于x的线性回归直线方程为:=0.85x+0.6;(2)当x=8时,=0.858+0.6=7.4(千万元),预测当补贴额达到8百万元时,该项目的经济回报为7.4千万元。
4、经验说明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高,由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高,下面给出了某林场在研究树高与胸径之间的关系时收集的某种树的数据:
(1)根据表绘制树高y与胸径x之间关系的散点图;
(2)分析树高y与胸径x之间的相关关系,并求y关于x的线性回归方程;
(3)预测当树的胸径为50.6cm时,数的高度约是多少(精确到0.01)(2021全国高考新高考II).
编号 1 2 3 4 5 6
胸径(cm) 18.1 20.1 22.2 24.4 26.0 28.3
树高(m) 18.8 19.2 21.0 21.0 22.1 22.1
编号 7 8 9 10 11 12
胸径(cm) 29.6 32.4 33.7 35.7 38.3 40.2
树高(m) 22.4 22.6 23.0 24.3 23.9 24.7
附:回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
【解析】
【考点】①随机变量散点图的定义与基本作法;②判断随机变量相关关系的基本方法;③线性回归方程的定义与性质;④求线性回归方程的基本方法;③统计预测的基本求法。
【解题思路】(1)根据表中数据和作随机变量散点图的基本方法,就可作出树高y与胸径x之间关系的散点图;(2)根据线性回归方程的性质和基本求法,结合问题条件,运用公式求出,的值就可得到y关于x的线性回归方程;(3)利用统计预测的基本方法,结合(2)的线性回归方程就可预测当树的胸径为50.6cm时,树的高度。
【详细解答】(1)由表中数据作出树高y与胸径 x之间关系的散点图如图所示:
(2)=(18.1+20.1+22.2+24.4+26.0+28.3+29.6+32.4+33.7+35.7+38.3+40.2)=29.08,
=(18..8+19.2+ 21.0+21.0+22.1+22.1+22.4+22.6+23.0+24.3+23.9+24.7)=22.09,
=7851.03,=10715.74,=
==0.25,=-=22.09-0.2529.08=14.82,即y关于x的线性回归方程为:=0.25x+14.82;(3)当x=50.6时,=0.2550.6+14.82=27.47(m),当树的胸径为50.6cm时,数的高度约是27.47m。
5、某种机械设备,随着使用年限的增加,它的使用功能渐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“值”换算成费用,称之为“失效费”,其中机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.30 3.30 3.60 4.40 4.80 5.20 5.30
(1)由表中数据可知,可用线性回归模型拟合y与x的关系,请用相关关系系数加以说明
(精确到0.01);
(2)求出y关于x的线性回归方程,并估算该种机械设备使用10年的失效费(2021成都市高三二诊)
线性回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
【解析】
【考点】①变量相关关系的定义与性质;②判断变量相关关系的基本方法;③线性回归方程的定义与性质;④求线性回归方程的基本方法;③统计预测的基本求法。
【解题思路】(1)根据表中数据和计算公式,求出相关系数r的值就可判断失效费 y与使用年限x之间线性相关;(2)根据线性回归方程的性质和基本求法,结合问题条件,运用公式求出,的值就可得到y关于x的线性回归方程;(3)利用统计预测的基本方法,结合(2)的线性回归方程就可预测当使用年限为10年时的失效费。
【详细解答】(1)=(1+2+3+4+5+6+7)=4,=(2.30+3.30+3.60+4.40+4.80+5.20
+5.30)=4.3,r=0.99,r0.99接近1,失效费y与使用年限x的线性相关程度很高,从而可以用线性回归模型拟合y与x的关系;(2)
===0.5,=-=4.3-0.54=2.3,y关于x的线性
回归方程为:=0.5x+2.3,当x=10时,=0.510+2.3=7.3(万元),估计该种机
械设备使用10年的失效费为7.3万元。
6、某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,制
作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润,该公司2013年至2019年的利润y关于年份代号x的统计数据如下表(一致该公司的年利润与年份代号线性相关):
年 份 2013 2014 2015 2016 2017 2018 2019
年份代号x 1 2 3 4 5 6 7
年利润y(单位:亿元) 29 33 36 44 48 52 59
(1)求y关于x的线性回归方程,并预测该公司2020年(年份代号记为8)的年利润;
(2)(理)当统计表中某年年利润的实际值大于由(1)中线性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2013年至2020年这8年中随机抽取2年,求恰有1(1)中线年为A级利润年的概率;(文)当统计表中某年年利润的实际值大于由性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年

展开更多......

收起↑

资源预览