资源简介 专题04 统计与概率(六大题型)题型01 统计估计与概率 1题型02 统计图表与概率 4题型03 随机变量的分布与特征 5题型04 线性回归及其综合应用 7题型05 独立性检验 列联表 11题型06 函数的实际应用与统计概率综合 15【解题规律·提分快招】1、离散型随机变量分布列的性质的应用 (1)利用“概率之和为1”可以求相关参数的值. (2)利用“在某个范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率. (3)可以根据性质判断所得分布列结果是否正确. 2、求离散型随机变量ξ的均值与方差的步骤 (1)理解ξ的意义,写出ξ可能的全部值. (2)求ξ取每个值的概率. (3)写出ξ的分布列. (4)由均值、方差的定义求E(ξ),D(ξ). 3、独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算. (3)比较χ2与临界值的大小关系,作统计推断.题型01 统计估计与概率【典例1-1】.(24-25高三上·上海金山·期末)某高中举行了一次知识竞赛.为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩作为样本进行统计.将成绩进行整理后,依次分为五组(),其中第1组的频率为第2组和第4组频率的等比中项.请根据下面的频率分布直方图(如图所示)解决下列问题:(1)求a、b的值;(2)从样本数据在两个小组内的学生中,用分层抽样的方法抽取7名学生,再从这7名学生中随机选出2人,求选出的两人恰好来自不同小组的概率;(3)某老师在此次竞赛成绩中抽取了10名学生的分数:已知这10个分数的平均数,方差,若剔除其中的95和81两个分数,求剩余8个分数的平均数与方差.【典例1-2】.(2024·上海青浦·一模)第七届中国国际进口博览会于 2024 年 11 月 5 日至 10 日在上海举办,某公司生产的 、 三款产品在博览会上亮相,每一种产品均有普通装和精品装两种款式,该公司每天产量如下表: (单位:个)产品 产品 产品普通装 180 400精品装 300 420 600现采用分层抽样的方法在某一天生产的产品中抽取 100 个,其中 款产品有30 个.(1)求 的值;(2)用分层抽样的方法在 款产品中抽取一个容量为5的样本,从样本中任取 2 个产品,求其中至少有一个精品装产品的概率;(3)对抽取到的 款产品样本中某种指标进行统计,普通装产品的平均数为10,方差为2, 精品装产品的平均数为12,方差为1.8,试估计这天生产的 款产品的某种指标的总体方差 (精确到 0.01 ).【变式1-1】.(2024·上海嘉定·一模)在一场盛大的电竞比赛中,有两支实力强劲的队伍甲和乙进行对决.比赛采用5局3胜制,最终的胜者将赢得10万元奖金,比赛过程中,每局比赛双方获胜的概率相互独立且甲队每局获胜概率为0.4,乙队每局获胜概率为0.6.比赛开始后,甲队先连胜两局,此时,主办方记录了两队队员在这两局比赛中的一些数据.甲队队员的击杀数(单位:个)数据如下:;乙队队员的击杀数(单位:个)数据如下:然而此时比赛场地突发技术故障,比赛不得不中止.请回答以下问题:(1)根据目前情况(甲队已连胜两局),写出甲 乙两队“采用5局3胜制”的比赛结果的样本空间;(2)根据所给数据,绘制甲 乙两队队员的击杀数分布的茎叶图;(3)在目前情况下(甲队已连胜两局),估算甲乙两队获胜概率,并据此分配10万元奖金.【变式1-2】.(2024·上海虹口·一模)2024年法国奥运会落下帷幕.某平台为了解观众对本次奥运会的满意度,随机调查了本市1000名观众,得到他们对本届奥运会的满意度评分(满分100分),平台将评分分为共5层,绘制成频率分布直方图(如图1所示).并在这些评分中以分层抽样的方式从这5层中再抽取了共20名观众的评分,绘制成茎叶图,但由于某种原因茎叶图受到了污损,可见部分信息如图2所示.(1)求图2中这20名观众的满意度评分的第35百分位数;(2)若从图2中的20名观众中再任选取3人做深度采访,求其中至少有1名观众的评分大于等于90分的概率;(3)已知这1000名观众的评分位于上的均值为67,方差为64.7,位于上的均值为73,方差为134.6,求这1000名观众的评分位于上的均值与方差.【变式1-3】.(24-25高三上·上海·期中)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,完成生产任务的工作时间不超过70分钟的工人为“优秀”,否则为“合格”.根据工人完成生产任务的工作时间(单位:分钟)绘制了如下茎叶图:(1)求40名工人完成生产任务所需时间的第75百分位数;(2)独立地从两种生产方式中各选出一个人,求选出的两个人均为优秀的概率;(3)为了解该工厂职工的基本信息,从工厂中抽取了100个职工的体重数据,发现全部介于45公斤到75公斤之间,现将100个体重数据分为6组:第一组,第二组,,第六组,得到如图所示的频率分布直方图.其中第一组有2人,第二组有13人.求与的值.题型02 统计图表与概率【典例2-1】.(2024·上海长宁·一模)2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”. (1)求所抽取的“青年人”的人数;(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.①简述如何采用抽签法任选2人;②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.【变式2-1】.(2024·上海奉贤·一模)某芯片代工厂生产甲、乙两种型号的芯片,为了解芯片的某项指标,从这两种芯片中各抽取100件进行检测,获得该项指标的频率分布直方图,如图所示:假设数据在组内均匀分布,以样本估计总体,以事件发生的频率作为相应事件发生的概率.(1)求频率分布直方图中x的值并估计乙型芯片该项指标的平均值(同一组中的数据用该组区间的中点值为代表);(2)已知甲型芯片指标在为航天级芯片,乙型芯片指标在为航天为航天级芯片.现分别采用分层抽样的方式,从甲型芯片指标在内取2件,乙型芯片指标在内取4件,再从这6件中任取2件,求至少有一件为航天级芯片的概率.【变式2-2】.(24-25高三上·上海松江·期末)某日用品按行业质量标准分成五个等级,等级系数依次为1、2、3、4、5,现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:1 2 3 4 5(1)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a、b、c的值;(2)在(1)的条件下,将等级系数为4的3件日用品记为、、,等级系数为5的2件日用品记为、,现从、、、、这5件日用品中任取两件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这两件日用品的等级系数恰好相等的概率.题型03 随机变量的分布与特征【典例3-1】.(2024·上海松江·二模)某素质训练营设计了一项闯关比赛.规定:三人组队参赛,每次只派一个人,且每人只派一次:如果一个人闯关失败,再派下一个人重新闯关;三人中只要有人闯关成功即视作比赛胜利,无需继续闯关.现有甲、乙、丙三人组队参赛,他们各自闯关成功的概率分别为、、,假定、、互不相等,且每人能否闯关成功的事件相互独立.(1)计划依次派甲乙丙进行闯关,若,,,求该小组比赛胜利的概率;(2)若依次派甲乙丙进行闯关,则写出所需派出的人员数目的分布,并求的期望;(3)已知,若乙只能安排在第二个派出,要使派出人员数目的期望较小,试确定甲、丙谁先派出.【典例3-2】.(24-25高三上·上海奉贤·期中)某市数学竞赛初赛结束后,为了解竞赛成绩情况,从所有学生中随机抽取名学生,得到他们的成绩,将数据分成五组:,,,,,并绘制成如图所示的频率分布直方图:(1)若只有前的学生能进决赛,则入围分数应设为多少分?(2)采用分层随机抽样的方法从成绩为的学生中抽取容量为的样本,再从该样本中随机抽取名学生进行问卷调查,设为其中达到分及以上的学生的人数,求的概率分布及数学期望.【变式3-1】.(24-25高三上·上海·开学考试)为了缓解高三学生学业压力,学校开展健美操活动,高三某班文艺委员调查班级学生是否愿意参加健美操,得到如下的列联表.性别 愿意 不愿意男生 6 10女生 18 6(1)根据该列联表,并依据显著水平的独立性检验,判断能否认为“学生性别与是否愿意参加健美操有关”;(2)在愿意参加的所有学生中,根据性别,分层抽样选取8位学生组织班级健美操队,并从中随机选取2人作为领队,记这2人中女生人数为随机变量,求的分布及期望.附:.【变式3-2】.(2023·上海闵行·三模)某学校有两个餐厅为学生提供午餐与晩餐服务,甲、乙两位学生每天午餐和晩餐都在学校就餐,近100天选择餐厅就餐情况统计如下:选择餐厅情况(午餐,晩餐)甲 30天 20天 40天 10天乙 20天 25天 15天 40天为了吸引学生就餐,餐厅推出就餐抽奖活动,获奖的概率为,而餐厅推出就餐送贴纸活动,每次就餐送一张.假设甲、乙选择餐厅就餐相互独立,用频率估计概率.(1)分别估计一天中甲午餐和晩餐都选择A餐厅就餐的概率,乙午餐和晩餐都选择B餐厅就餐的概率;(2)记为学生乙在一天中获得贴纸的数量,求的分布列和数学期望;(3)餐厅推出活动当天学生甲就参加了抽奖活动,已知如果学生甲抽中奖品,则第二天午餐再次去餐厅就餐的概率为,如果学生甲并没有抽中奖品,第二天午餐依然在餐厅就餐的概率为,若餐厅推出活动的第二天学生甲午餐去餐厅就餐的概率是,求.【变式3-3】.(24-25高三上·上海松江·阶段练习)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:赔偿次数 0 1 2 3 4单数 800 100 60 30 10假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.(1)估计一份保单索赔次数不少于2的概率;(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.(i)记为一份保单的毛利润,估计的数学期望;(ii)如果无索赔的保单的保费减少4%,有索赔的保单的保费增加20%,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.【变式3-4】.(23-24高三下·上海青浦·阶段练习)中国首个海外高铁项目——雅万高铁全线长142.3千米,共设有哈利姆站、卡拉旺站、帕达拉朗站、德卡伯尔站4个车站.在运营期间,铁路公司随机选取了100名乘客的乘车记录,统计分析,得到下表(单位:人):下车站上车站 卡拉旺站 帕达拉朗站 德卡鲁尔站 总计哈利姆站 5 20 15 40卡拉旺站 10 20 30帕达拉朗站 30 30总计 5 30 65 100用频率代替概率,根据上表解决下列问题:(1)在运营期间,从卡拉旺站上车的乘客中任选3人,设这3人到德卡鲁尔站下车的人数为随机变量,求的分布列及其数学期望;(2)已知地处在哈利姆站与卡拉旺站之间,地居民到哈利姆站乘车的概率为,到卡拉旺站乘车的概率为(地居民不可能在卡拉旺站下车).在高铁离开卡拉旺站时,求从哈利姆站上车的乘客来自地的概率与从卡拉旺站上车的乘客来自地的概率的比值.题型04 线性回归及其综合应用【典例4-1】.(2024·上海·一模)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:克每立方米)与样本对原点的距离(单位:米)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中).6 97.90 0.21 240 0.14 14.12 26.13(1)利用相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型;(2)根据(1)的结果建立关于的回归方程,并估计样本对原点的距离米时,平均金属含量是多少?【典例4-2】.(2023·上海杨浦·模拟预测)某科技公司为确定下一年度投入某种产品的研发费,需了解年研发费x(单位:万元)对年销售量y(单位:百件)和年利润(单位:万元)的影响,现对近6年的年研发费和年销售量(,2,…,6)数据作了初步处理,得到下面的散点图及一些统计量的值. 12.5 222 3.5 157.5 16800 4.5 1254 270表中,.(1)根据散点图判断与哪一个更适宜作为年研发费x的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润,根据(2)的结果,当年研发费为多少时,年利润z的预报值最大?附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计分别为,.【变式4-1】.(2023·上海奉贤·一模)某连锁便利店从年到年销售商品品种为种,从年开始,该便利店进行了全面升级,销售商品品种为种.下表中列出了从年到年的利润额.年份利润额 /万元(1)若某年的利润额超过万元,则该便利店当年会被评选为示范店;若利润额不超过万元,则该便利店当年不会被评选为示范店.试完成列联表,并判断商品品种数量与便利店是否为示范店有关?(显著性水平,)品种为种 品种为种 总计被评为示范店次数未被评为示范店次数总计(2)请根据年至年(剔除年的数据)的数据建立与的线性回归模型①;根据年至年的数据建立与的线性回归模型②.分别用这两个模型,预测年该便利店的利润额并说明这样的预测值是否可靠?(回归系数精确到,利润精确到万元)回归系数与的公式如下:【变式4-2】.(2024·上海·模拟预测)某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离 56 63 71 79 90 102 110 117损坏零件数(个) 61 73 90 105 119 136 149 163(1)建立关于的回归模型,根据所给数据及回归模型,求回归方程及相关系数.(精确到0.1,精确到1,精确到0.0001)(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?保养 未保养 合计报废 20未报废合计 60 100附:,0.050 0.010 0.0013.841 6.635 10.828【变式4-3】.(23-24高三下·上海浦东新·阶段练习)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的的平均浓度(单位:). 调研人员采集了50天的数据,制作了关于的散点图,并用直线与将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.(1)完成下面的列联表,并判断至少有多大把握认为“平均浓度不小于与“汽车日流量不小于1500辆”有关;汽车日流量 汽车日流量 合计的平均浓度的平均浓度合计(2)经计算得回归方程为,且这50天的汽车日流量的标准差,的平均浓度的标准差.①求相关系数,并判断该回归方程是否有价值;②若这50天的汽车日流量满足,试推算这50天的日均浓度的平均数.(精确到0.1)参考公式:,其中.0.100 0.050 0.010 0.0012.706 3.841 6.635 10.828回归方程,其中.相关系数. 若,则认为与有较强的线性相关性.题型05 独立性检验 列联表【典例5-1】.(24-25高三上·上海·期中)学校为了解学生对“公序良俗”的认知情况,设计了一份调查表,题目分为必答题和选答题.其中必答题是①、②、③共三道题,选答题为④、⑤、⑥、⑦、⑧、⑨、⑩共七道题,被调查者在选答题中自主选择其中道题目回答即可.现从④、⑥、⑧、⑩四个题目中至少选答一道的学生中随机抽取名学生进行调查,他们选答④、⑥、⑧、⑩的题目数及人数统计如表:选答④、⑥、⑧、⑩的题目数 1道 2道 3道 4道人数(1)现规定:同时选答④、⑥、⑧、⑩的学生为“公序良俗”达人.学校还调查了这位学生的性别情况,研究男女生中“公序良俗”达人的大概比例,得到的数据如下表:性别 “公序良俗”达人 非“公序良俗”达人 总计男性女性总计请完成上述列联表,并根据小概率值的独立性检验,分析“公序良俗”达人与性别是否有关.(2)从这名学生中任选名,记表示这名学生选答④、⑥、⑧、⑩的题目数之差的绝对值,求随机变量的分布和数学期望.参考公式:,其中.附表见上图.【典例5-2】.(24-25高三上·上海·阶段练习)为了了解广大消费者购买新能源汽车意向与年龄是否具有相关性,某汽车APP采用问卷调查形式对400名消费者进行调查,数据显示这400人中中老年人共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍;青年中愿意购买新能源车的人数是愿意购买燃油车的4倍.年龄段 购车意向 合计愿意购买新能源车 愿意购买燃油车青年中老年合计(1)完善2×2列联表,请根据小概率值的独立性检验,分析消费者对新能源车和燃油车的意向购买与年龄是否有关;(2)采用分层随机抽样从愿意购买新能源车的消费者中抽取9人,再从这9人中随机抽取5人,求这5人中青年人数的分布和期望.附:,.0.05 0.01 0.0013.841 6.635 10.828【变式5-1】.(24-25高三上·上海·阶段练习)某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生是否同意“三项体育活动中要有篮球”,学校随机调查了名学生,数据如表:男生 女生 合计同意不同意合计(1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关 (2)现有足球、篮球、跳绳供学生选择.若甲、乙两学生从三项运动中随机选一种(他们的选择相互独立).若在甲学生选择足球的前提下,两人的选择不同的概率为.记事件为“甲学生选择足球”,事件为“甲、乙两名学生的选择不同”,判断事件是否独立,并说明理由.(3)经观察,该校学生每分钟跳绳个数,由往年经验,训练后每人每分钟跳绳个数比开始时增加个,该校有名学生,预估经过训练后每分钟跳个以上人数(结果四舍五入到整数).参考公式和数据:,其中;若,则,,.【变式5-2】.(24-25高三上·上海·期中)2024年某瓷器公司计划向市场推出两种高档中国红瓷杯A和,已知A和烧制成功率分别为和,烧制成功一个A,盈利30元,否则亏损10元;烧制成功一个,盈利80元,否则亏损20元.(1)设为烧制一个A和一个所得的利润之和,求随机变量的分布和数学期望;(2)求烧制4个A所得的利润不少于80元的概率;(3)公司将用户对中国红瓷器的喜欢程度分为“非常满意”(得分不低于85分)和“满意”(得分低于85分)两类,通过调查完成下表.年龄低于45岁 6 14 42 31 7年龄不低于45岁 4 6 47 35 8根据调查数据完成下列列联表,并依据显著性水平的独立性检验,判断居民对瓷器的喜欢程度是否与年龄有关联?非常满意 满意 合计年龄低于45岁年龄不低于45岁合计附:,,,与的若干对应数值见下表:0.25 0.05 0.0051.323 3.841 7.879【变式5-3】.(24-25高三上·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活。现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:喜欢网上买菜 不喜欢网上买菜 合计年龄不超过45岁的市民 40 10 50年龄超过45岁的市民 20 30 50合计 60 40 100(1)能否有95%的把握认为社区的市民是否喜欢网上头菜与年龄有关?(2)M社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;(3)用频率估计概率,现从M社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求、的期望和方差.参考公式:,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【变式5-4】.(24-25高三·上海·课堂例题)“日行万步”正成为健康生活的代名词.某地一研究团队统计了该地区1000位居民的日行步数,得到如下表格:日行步数(单位:千步)人数(人) 20 60 170 200 300 200 50(1)为研究日行步数与居民年龄的关系,以日行步数是否超过8千步为标准进行分层抽样,从上述1000位居民中抽取200人,得到如下列联表,请将列联表补充完整,并根据2列联表判断是否有95%把握认为日行步数与居民年龄超过40岁有关;日行步数千步 日行步数>8千步 总计40岁以上(人) 10040岁以下(含40岁)(人) 50总计 2000.50 0.40 0.25 0.15 0.010 0.05 0.025 0.0100.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635(2)以这1000位居民日行步数超过8千步的频率,代替该地区1位居民日行步数超过8千的概率,每位居民日行步数是否超过8千相互独立.为了深入研究,该研究团队随机调查了20位居民,其中日行步数超过8千的最有可能(即概率最大)是多少位居民?【变式5-5】.(2024·上海徐汇·二模)为了解中草药甲对某疾病的预防效果,研究人员随机调查了100名人员,调查数据如表.(单位:个)未患病者 患病者 合计未服用 中草药甲服用 中草药甲合计(1)若规定显著性水平,试分析中草药甲对预防此疾病是否有效;(2)已知中草药乙对该疾病的治疗有效率数据如下:对未服用过中草药甲的患者治疗有效率为,对服用过中草药甲的患者治疗有效率为.若用频率估计概率,现从患此疾病的人员中随机选取2人(分两次选取,每次1人,两次选取的结果独立)使用中草药乙进行治疗,记治疗有效的人数为,求的分布和数学期望.附:,.0.100 0.050 0.010 0.0012.706 3.841 6.635 10.828题型06 函数的实际应用与统计概率综合【典例6-1】.(2023·上海金山·二模)某网站计划4月份订购草莓在网络销售,每天的进货量相同,成本价为每盒15元.假设当天进货能全部售完,决定每晚七点前(含七点)售价为每盒20元,每晚七点后售价为每盒10元.根据销售经验,每天晚七点前的购买量与网站每天的浏览量(单位:万次)有关.为确定草莓的进货量,相关人员统计了前两年4月份(共60天)网站每天的浏览量(单位:万次)、晚七点前购买草莓的数量(单位:盒)以及达到该流量的天数,如下表所示:每天的浏览量每天晚七点前的购买量 300 900天数 36 24以每天的浏览量位于各区间的频率代替浏览量位于该区间的概率.(1)求4月份草莓一天晚七点前的购买量(单位:盒)的分布;(2)设4月份销售草莓一天的利润为(单位:元),一天的进货量为(单位:盒),为正整数且,当为多少时,的期望达到最大值,并求此最大值.【变式6-1】.(2023·上海长宁·二模)某地新能源汽车保有量符合阻沛型增长模型,其中为自统计之日起,经过t年后该地新能源汽车保有量、和r为增长系数、M为饱和量.下表是该地近6年年底的新能源汽车的保有量(万辆)的统计数据:年份 2018 2019 2020 2021 2022t 0 1 2 3 4保有量 9.6 12.9 17.1 23.2 31.4假设该地新能源汽车饱和量万辆.(1)若,假设2018年数据满足公式,计算的值(精确到0.01)并估算2023年年底该地新能源汽车保有量(精确到0.1万辆);(2)设,则与t线性相关.请依据以上表格中相关数据,利用线性回归分析确定和r的值(精确到0.01).附:线性回归方程中回归系数计算公式如下:.【变式6-2】.(2023·上海浦东新·模拟预测)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中)6 60(1)利用样本相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?(2)根据(1)的结果回答下列问题:(i)建立关于的回归方程;(ii)样本对原点的距离时,金属含量的预报值是多少?(3)已知该金属在距离原点米时的平均开采成本(单位:元)与关系为,根据(2)的结果回答,为何值时,开采成本最大?【变式6-3】.(2023·上海松江·二模)某城市响应国家号召,积极调整能源结构,推出多种价位的新能源电动汽车.根据前期市场调研,有购买新能源车需求的约有2万人,他们的选择意向统计如下:车型 A B C D E F价格 9万元 12万元 18万元 24万元 30万元 40万元占比 5% 15% 25% 35% 15% 5%(1)如果有购车需求的这些人今年都购买了新能源车,今年新能源车的销售额预计约为多少亿元?(2)车企推出两种付款方式:全款购车:购车时一次性付款可优惠车价的3%;分期付款:无价格优惠,购车时先付车价的一半,余下的每半年付一次,分4次付完,每次付车价的.①某位顾客现有a万元现金,欲购买价值a万元的某款车,付款后剩余的资金全部用于购买半年期的理财产品(该理财产品半年期到期收益率为1.8%),到期后,可用资金(含理财收益)继续购买半年期的理财产品,问:顾客选择哪一种付款方式收益更多?(计算结果精确到0.0001)②为了激励购买理财产品,银行对采用分期付款方式的顾客,赠送价值1888元的大礼包,试问:这一措施对哪些车型有效?(计算结果精确到0.0001)一、解答题1.(2023·上海普陀·一模)我国随着人口老龄化程度的加剧,劳动力人口在不断减少,“延迟退休”已成为公众关注的热点话题之一,为了了解公众对“延迟退休”的态度,某研究机构对属地所在的一社区进行了调查,并将随机抽取的50名被调查者的年龄制成如图所示的茎叶图.(1)经统计发现,投赞成票的人均年龄恰好是这50人年龄的第60百分位数,求此百分位数;(2)经统计年龄在的被调查者中,投赞成票的男性有3人,女性有2人,现从该组被调查者中随机选取男女各2人进行跟踪调查,求被选中的4人中至少有3人投赞成票的概率(结果用最简分数表示)2.(2024·上海徐汇·一模)某企业招聘员工,指定“英语听说” “信息技术” “逻辑推理”作为三门考试课程,有两种考试方案.方案一:参加三门课程的考试,至少有两门及格为通过;方案二:在三门课程中,随机选取两门,并参加这两门课程的考试,两门都及格为通过.假设某应聘者参加三门指定课程考试及格的概率分别是.,且三门课程考试是否及格相互之间没有影响.(1)分别求该应聘者选方案一考试通过的概率和选方案二考试通过的概率;(2)试比较该应聘者在上述两种方案下考试通过的概率的大小,并说明理由.3.(2024·上海奉贤·三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:假设1:各回合比赛相互独立;假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?4.(2024·上海·模拟预测)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:时间范围学业成绩优秀 5 44 42 3 1不优秀 134 147 137 40 27(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?(附:其中,.)5.(2024·上海·三模)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成,,九组,绘制成如图所示的频率分布直方图.(1)现认为大于10小时的公益劳动时间为长,小于10小时的公益劳动时间为短,填写下列列联表,并判断是否有95%把握认为公益劳动时间与学生性别有关.性别 公益劳动时间 合计长 短男 110女 120合计(2)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在内的学生人数为,求的分布列和期望;(3)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“”表示这20名学生中恰有名学生参加公益劳动时间在](单位:小时)内的概率,其中.当最大时,写出的值.0.100 0.050 0.025 0.0102.706 3.841 5.024 6.6356.(2024·上海·三模)为了解人们是否喜欢跑步,某机构在一小区随机抽取了40人进行调查,统计结果如下表.喜欢 不喜欢 合计男 12 8 20女 10 10 20合计 22 18 40(1)根据以上数据,判断能否有95%的把握认为人们对跑步的喜欢情况与性别有关?附:,其中,(2)该小区居民张先生每天跑步或开车上班,据以往经验,张先生跑步上班准时到公司的概率为,张先生跑步上班迟到的概率为.对于下周(周一~周五)上班方式张先生作出如下安排:周一跑步上班,从周二开始,若前一天准时到公司,当天就继续跑步上班,否则,当天就开车上班,且因公司安排,周五开车去公司(无论周四是否准时到达公司).设从周一开始到张先生第一次开车去上班前跑步上班的天数为X,求X的分布列及数学期望.7.(2024·上海·三模)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期,一研究团队在当地感染某一种传染病的人群中随机抽取了200名患者,其中潜伏期超过5天的患者人数为80.(1)为了研究这200名患者中潜伏期超过5天的群体与不超过5天的群体的性别是否有显著性差异,该团队将患者按性别分成两组进行对比,人数分布如下表所示:潜伏期≤5天 潜伏期>5天 总计男 67 34 101女 53 46 99总计 120 80 200请根据表中数据,判断这两类人群的性别有无显著性差异(显著性水平),并说明理由;(附:,其中,)(2)为了进一步深化研究,该团队拟在当地随机抽取名患者开展个案分析.现用200名患者中潜伏期超过5天的频率值,作为“从当地随机抽取一名患者,其潜伏期超过5天”的概率的估计值.若该团队希望事件“这n名患者中,至少有2人的潜伏期超过5天”发生的概率不低于0.9,同时为了保障个案分析的质量,考虑到时间与成本的制约,希望抽取的患者数尽可能少,则该团队应该抽取多少名患者 8.(2024·上海·三模)某市举行了一次大型宣传活动,会后组办方分别从7个不同的地方的问卷调查中各随机抽取了相同数量的数据构成一个样本,依据相关的标准该样本中各地抽取的数据人均得分构成数列,且,由各地的得分可以认为各地人均得分2服从正态分布,近似为抽取的样本中7个地方人均得分的平均值(得分的平均值四舍五入并取整数).(1)利用正态分布的知识求;(2)组办方为此次参加问卷调查的市民制定如下两种奖励方案:方案一:(i)得分不低于的可以获赠2次随机话费,得分低于的可以获赠1次随机话费;(ii)每次获赠的随机话费和对应的概率为获赠的随机话费(单位:元) 50 100概率方案二:参加了此次问卷调查的市民可获得价值100元的“元旦迎新”大型晚会活动入场券,参加了此次问卷调查的市民可选择其中一种奖励方案.①市民小李参加了此次问卷调查,记X(单位:元)为小李参加问卷调查获赠的话费,求X的分布列及数学期望;②请问小李是选择参加获赠随机话费活动,还是获得价值100元的参加“元旦迎新”入场券?请用统计中相关知识为小李作出决策.(附:若,则,,)21世纪教育网(www.21cnjy.com)21世纪教育网(www.21cnjy.com)21世纪教育网(www.21cnjy.com)专题04 统计与概率(六大题型)题型01 统计估计与概率 1题型02 统计图表与概率 7题型03 随机变量的分布与特征 10题型04 线性回归及其综合应用 17题型05 独立性检验 列联表 25题型06 函数的实际应用与统计概率综合 36【解题规律·提分快招】1、离散型随机变量分布列的性质的应用 (1)利用“概率之和为1”可以求相关参数的值. (2)利用“在某个范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率. (3)可以根据性质判断所得分布列结果是否正确. 2、求离散型随机变量ξ的均值与方差的步骤 (1)理解ξ的意义,写出ξ可能的全部值. (2)求ξ取每个值的概率. (3)写出ξ的分布列. (4)由均值、方差的定义求E(ξ),D(ξ). 3、独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算. (3)比较χ2与临界值的大小关系,作统计推断.题型01 统计估计与概率【典例1-1】.(24-25高三上·上海金山·期末)某高中举行了一次知识竞赛.为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩作为样本进行统计.将成绩进行整理后,依次分为五组(),其中第1组的频率为第2组和第4组频率的等比中项.请根据下面的频率分布直方图(如图所示)解决下列问题:(1)求a、b的值;(2)从样本数据在两个小组内的学生中,用分层抽样的方法抽取7名学生,再从这7名学生中随机选出2人,求选出的两人恰好来自不同小组的概率;(3)某老师在此次竞赛成绩中抽取了10名学生的分数:已知这10个分数的平均数,方差,若剔除其中的95和81两个分数,求剩余8个分数的平均数与方差.【答案】(1),;(2);(3)平均数为88,方差为19.【分析】(1)根据频率直方图,应用频率和为1及等比中项性质列方程求参数;(2)根据分层抽样的等比例性质有来自的分别为2人、5人,结合组合数及古典概型的概率求法求概率;(3)由平均数、方差公式求剔除数据后的平均数和方差.【解析】(1)由题设,且,所以且,故,所以,.(2)由题图知:在两个小组内的学生人数比为,所以抽取7名学生中,来自的分别为2人、5人,随机选出2人,两人恰好来自不同小组的概率.(3)由题设得,,假设剔除的两个为,则平均值为,此时方差为.【典例1-2】.(2024·上海青浦·一模)第七届中国国际进口博览会于 2024 年 11 月 5 日至 10 日在上海举办,某公司生产的 、 三款产品在博览会上亮相,每一种产品均有普通装和精品装两种款式,该公司每天产量如下表: (单位:个)产品 产品 产品普通装 180 400精品装 300 420 600现采用分层抽样的方法在某一天生产的产品中抽取 100 个,其中 款产品有30 个.(1)求 的值;(2)用分层抽样的方法在 款产品中抽取一个容量为5的样本,从样本中任取 2 个产品,求其中至少有一个精品装产品的概率;(3)对抽取到的 款产品样本中某种指标进行统计,普通装产品的平均数为10,方差为2, 精品装产品的平均数为12,方差为1.8,试估计这天生产的 款产品的某种指标的总体方差 (精确到 0.01 ).【答案】(1)100;(2);(3).【分析】(1)由分层随机抽样的抽样比直接计算即可;(2)由古典概型结合组合数公式即可求解;(3)根据分层抽样总体的方差公式求解即可.【解析】(1)由题意可知,该工厂一天所生产的产品数为现采用分层抽样的方法在这一天生产的产品中抽取100个,其中B款产品有30个,则,解得.(2)设所抽取的样本中有个精品装产品,则,解得所以容量为5的样本中,有3个精品装产品,2个普通装产品.因此从样本中任取 2 个产品,至少有1个精品装产品的概率为(3)由题意,某项指标总体的平均数为,所以由分层抽样的总体方差公式可得【变式1-1】.(2024·上海嘉定·一模)在一场盛大的电竞比赛中,有两支实力强劲的队伍甲和乙进行对决.比赛采用5局3胜制,最终的胜者将赢得10万元奖金,比赛过程中,每局比赛双方获胜的概率相互独立且甲队每局获胜概率为0.4,乙队每局获胜概率为0.6.比赛开始后,甲队先连胜两局,此时,主办方记录了两队队员在这两局比赛中的一些数据.甲队队员的击杀数(单位:个)数据如下:;乙队队员的击杀数(单位:个)数据如下:然而此时比赛场地突发技术故障,比赛不得不中止.请回答以下问题:(1)根据目前情况(甲队已连胜两局),写出甲 乙两队“采用5局3胜制”的比赛结果的样本空间;(2)根据所给数据,绘制甲 乙两队队员的击杀数分布的茎叶图;(3)在目前情况下(甲队已连胜两局),估算甲乙两队获胜概率,并据此分配10万元奖金.【答案】(1);(2)茎叶图见解析;(3)甲乙获胜的概率分别为,奖金分别为万元和万元.【分析】(1)根据给定条件,写出比赛结果的样本空间.(2)绘制击杀数分布的茎叶图.(3)利用相互独立事件的概率及对立事件的概率估计概率,再按概率分配奖金.【解析】(1)用表示甲队在第局获胜,则表示乙队第局获胜,所以所求样本空间.(2)甲 乙两队队员的击杀数分布的茎叶图,如图,(3)乙队获胜的事件为,则,,因此甲队获胜的概率为,由此分配10万元奖金,甲队分得(万元),乙队分得万元.【变式1-2】.(2024·上海虹口·一模)2024年法国奥运会落下帷幕.某平台为了解观众对本次奥运会的满意度,随机调查了本市1000名观众,得到他们对本届奥运会的满意度评分(满分100分),平台将评分分为共5层,绘制成频率分布直方图(如图1所示).并在这些评分中以分层抽样的方式从这5层中再抽取了共20名观众的评分,绘制成茎叶图,但由于某种原因茎叶图受到了污损,可见部分信息如图2所示.(1)求图2中这20名观众的满意度评分的第35百分位数;(2)若从图2中的20名观众中再任选取3人做深度采访,求其中至少有1名观众的评分大于等于90分的概率;(3)已知这1000名观众的评分位于上的均值为67,方差为64.7,位于上的均值为73,方差为134.6,求这1000名观众的评分位于上的均值与方差.【答案】(1)(2)(3)这1000名观众的评分位于上的均值与方差分别为,.【分析】(1)根据百分位数的定义求解即可;(2)先求出的人数,利用对立事件结合古典概型求解即可;(3)根据题意利用分层抽样的平均数和方差公式运算求解.【解析】(1)∵,∴第35百分位数为第两个数的平方数(2)由图1可知,图2中有2人,所以从图2中的20名观众中再任选取3人做深度采访,求其中至少有1名观众的评分大于等于90分设为事件,所以.(3)由题意可知:落在的频率为,落在的频率为,因为这1000名观众的评分位于上的均值为67,方差为64.7,位于上的均值为73,方差为134.6,所以,设这1000名观众的评分位于上的均值与方差分别为,所以,解得:,,解得:.这1000名观众的评分位于上的均值与方差分别为,.【变式1-3】.(24-25高三上·上海·期中)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,完成生产任务的工作时间不超过70分钟的工人为“优秀”,否则为“合格”.根据工人完成生产任务的工作时间(单位:分钟)绘制了如下茎叶图:(1)求40名工人完成生产任务所需时间的第75百分位数;(2)独立地从两种生产方式中各选出一个人,求选出的两个人均为优秀的概率;(3)为了解该工厂职工的基本信息,从工厂中抽取了100个职工的体重数据,发现全部介于45公斤到75公斤之间,现将100个体重数据分为6组:第一组,第二组,,第六组,得到如图所示的频率分布直方图.其中第一组有2人,第二组有13人.求与的值.【答案】(1)(2)(3);【分析】(1)按照求百分数的计算步骤计算即可;(2)分别算出第一种与第二种生产方式中优秀的概率相乘即可;(3)据直方图面积为1的性质及第一组第二组的人数建立方程组,解出,进而得解.【解析】(1)40名工人完成生产任务所需时间按从小到大排列为:,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,因为,所以第75百分数为;(2)由题意可知,第一种生产方式中优秀的概率为,第二种生产方式中优秀的概率为,所以选出的两个人均为优秀的概率为.(3)依题意,则,又因为,所以,因为,所以,所以,所以,.题型02 统计图表与概率【典例2-1】.(2024·上海长宁·一模)2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”. (1)求所抽取的“青年人”的人数;(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.①简述如何采用抽签法任选2人;②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.【答案】(1)80(2)①答案见解析;②事件A与事件B不独立,理由见解析【分析】(1)根据频率分布直方图求得的值,然后求得“青年人”人数占比,从而可得“青年人”人数;(2)①利用简单随机抽样设计抽签法任选2人即可;②根据独立事件判断公式,结合超几何分布概率问题求解,从而可得结论.【解析】(1)由频率分布直方图可得,解得:,又“青年人”占比为,所以所抽取的“青年人”人数为人;(2)①先将10名参会者进行编号:1、2、、10,并将10个号码写在完全相同的纸片上,放入某容器中充分混合均匀,再取出2张,2张纸片上所对应的参会者就是要选取的人,②“青年人”“中年人”“老年人”的人数之比为,所以10人中“中年人”共有5人,2人均为“中年人”的概率,2人中至少有1人为男性的概率,2人均为“中年人”且至少有1人为男性的概率,因为,所以事件A与事件B不独立.【变式2-1】.(2024·上海奉贤·一模)某芯片代工厂生产甲、乙两种型号的芯片,为了解芯片的某项指标,从这两种芯片中各抽取100件进行检测,获得该项指标的频率分布直方图,如图所示:假设数据在组内均匀分布,以样本估计总体,以事件发生的频率作为相应事件发生的概率.(1)求频率分布直方图中x的值并估计乙型芯片该项指标的平均值(同一组中的数据用该组区间的中点值为代表);(2)已知甲型芯片指标在为航天级芯片,乙型芯片指标在为航天为航天级芯片.现分别采用分层抽样的方式,从甲型芯片指标在内取2件,乙型芯片指标在内取4件,再从这6件中任取2件,求至少有一件为航天级芯片的概率.【答案】(1),.(2).【分析】(1)由频率和为1求出得值,根据平均数公式求出平均值.(2)根据条件列举样本容量和样本点的方法,列式求解.【解析】(1)由题意得,解得.由频率分布直方图得乙型芯片该项指标的平均值:.(2)根据分层抽样得,来自甲型芯片指标在和的各1件,分别记为和,来自甲型芯片指标在和分别为3件和1件,分别记为,,和,从中任取2件,样本空间可记为,,,,,,,,,,,,,,共15个,记事件:至少有一件为航天级芯片,则,,,,,,,,共9个,所以.【变式2-2】.(24-25高三上·上海松江·期末)某日用品按行业质量标准分成五个等级,等级系数依次为1、2、3、4、5,现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:1 2 3 4 5(1)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a、b、c的值;(2)在(1)的条件下,将等级系数为4的3件日用品记为、、,等级系数为5的2件日用品记为、,现从、、、、这5件日用品中任取两件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这两件日用品的等级系数恰好相等的概率.【答案】(1),,(2)所有可能的结果详见解析;概率为.【分析】(1)根据频率和频数的关系可求的值,根据频率和为可求的值.(2)用列举法写出所有的可能性,再结合古典概型公式求解即可.【解析】(1)因为等级系数为4的恰有3件,所以;等级系数为5的恰有2件,所以;因为,所以.故,,.(2)从、、、、这5件日用品中任取两件,所有可能得结果有:,,,,,,,,,共10种情况.这两件日用品的等级系数恰好相等的结果有:,,,,共4个.因为每种结果出现的可能性相同,所以这两件日用品的等级系数恰好相等的概率为:.题型03 随机变量的分布与特征【典例3-1】.(2024·上海松江·二模)某素质训练营设计了一项闯关比赛.规定:三人组队参赛,每次只派一个人,且每人只派一次:如果一个人闯关失败,再派下一个人重新闯关;三人中只要有人闯关成功即视作比赛胜利,无需继续闯关.现有甲、乙、丙三人组队参赛,他们各自闯关成功的概率分别为、、,假定、、互不相等,且每人能否闯关成功的事件相互独立.(1)计划依次派甲乙丙进行闯关,若,,,求该小组比赛胜利的概率;(2)若依次派甲乙丙进行闯关,则写出所需派出的人员数目的分布,并求的期望;(3)已知,若乙只能安排在第二个派出,要使派出人员数目的期望较小,试确定甲、丙谁先派出.【答案】(1)(2)(3)先派出甲【分析】(1)利用独立事件的概率乘法公式求解;(2)由题意可知,的所有可能取值为1,2,3,利用独立事件的概率乘法公式求出相应的概率,进而得到的分布,再结合期望公式求解;(3)分别计算出依次派甲乙丙进行闯关和依次派丙乙甲进行闯关,所派出人员数目的期望,再利用作差法比较大小即可.【解析】(1)设事件表示“该小组比赛胜利”,则;(2)由题意可知,的所有可能取值为1,2,3,则,,,所以的分布为:所以;(3)若依次派甲乙丙进行闯关,设派出人员数目的期望为,由(2)可知,,若依次派丙乙甲进行闯关,设派出人员数目的期望为,则,则,因为,所以,,所以,即,所以要使派出人员数目的期望较小,先派出甲.【典例3-2】.(24-25高三上·上海奉贤·期中)某市数学竞赛初赛结束后,为了解竞赛成绩情况,从所有学生中随机抽取名学生,得到他们的成绩,将数据分成五组:,,,,,并绘制成如图所示的频率分布直方图:(1)若只有前的学生能进决赛,则入围分数应设为多少分?(2)采用分层随机抽样的方法从成绩为的学生中抽取容量为的样本,再从该样本中随机抽取名学生进行问卷调查,设为其中达到分及以上的学生的人数,求的概率分布及数学期望.【答案】(1)分(2)分布列见解析,【分析】(1)根据百分位数的定义,结合频率分布直方图,可得答案;(2)写出变量的可能取值,分别求得概率,写出分布列,利用期望公式,可得答案.【解析】(1)成绩在区间的比例为:;成绩在区间的比例为:,因此分位数位于区间;因此入围分数为:,因此入围分数应设为分.(2)在这六个人中,有两人的分数在分及以上,因此,,,,变量的分布列为:所以的数学期望为.【变式3-1】.(24-25高三上·上海·开学考试)为了缓解高三学生学业压力,学校开展健美操活动,高三某班文艺委员调查班级学生是否愿意参加健美操,得到如下的列联表.性别 愿意 不愿意男生 6 10女生 18 6(1)根据该列联表,并依据显著水平的独立性检验,判断能否认为“学生性别与是否愿意参加健美操有关”;(2)在愿意参加的所有学生中,根据性别,分层抽样选取8位学生组织班级健美操队,并从中随机选取2人作为领队,记这2人中女生人数为随机变量,求的分布及期望.附:.【答案】(1)能(2)分布列见解析,【分析】(1)完善列联表,作出零假设,根据独立性检验公式计算的值,推断出零假设成立与否,从而得出判断;(2)根据列联表得出选取8人中男生与女生人数,由超几何分布计算出对应概率值,得出随机变量的分布列,求出数学期望.【解析】(1)列联表如下:性别 愿意 不愿意 合计男生 6 10 16女生 18 6 24合计 24 16 40零假设为:是否愿意参加健美操与学生性别无关.根据列联表中的数据,可得,根据小概率值的独立性检验,我们推断不成立,既认为是否愿意参加健美操与学生性别有关联,此判断犯错误的概率不大于0.005.(2)根据列联表可得愿意参加健美操的学生中女生占全部的,∴选取的8人中,女生有人,男生有人,∴随机变量的可取值:0,1,2.∴,,.∴随机变量的分布列:0 1 2数学期望.【变式3-2】.(2023·上海闵行·三模)某学校有两个餐厅为学生提供午餐与晩餐服务,甲、乙两位学生每天午餐和晩餐都在学校就餐,近100天选择餐厅就餐情况统计如下:选择餐厅情况(午餐,晩餐)甲 30天 20天 40天 10天乙 20天 25天 15天 40天为了吸引学生就餐,餐厅推出就餐抽奖活动,获奖的概率为,而餐厅推出就餐送贴纸活动,每次就餐送一张.假设甲、乙选择餐厅就餐相互独立,用频率估计概率.(1)分别估计一天中甲午餐和晩餐都选择A餐厅就餐的概率,乙午餐和晩餐都选择B餐厅就餐的概率;(2)记为学生乙在一天中获得贴纸的数量,求的分布列和数学期望;(3)餐厅推出活动当天学生甲就参加了抽奖活动,已知如果学生甲抽中奖品,则第二天午餐再次去餐厅就餐的概率为,如果学生甲并没有抽中奖品,第二天午餐依然在餐厅就餐的概率为,若餐厅推出活动的第二天学生甲午餐去餐厅就餐的概率是,求.【答案】(1)0.3,0.4(2),分布列见解析(3)【分析】(1)根据古典概型公式计算即可.(2)求得的可能取值及对应概率完成分布列,根据离散型随机变量的期望公式求解即可.(3)根据全概率和条件概率公式求解即可.【解析】(1)设事件C为“一天中甲员工午餐和晩餐都选择A餐厅就餐”,事件D为“乙员工午餐和晩餐都选择B餐厅就餐”,因为100个工作日中甲员工午餐和晩餐都选择A餐厅就餐的天数为30,乙员工午餐和晩餐都选择B餐厅就餐的天数为40,所以.(2)由题意知,可以取的值为:0,1,2,,,故的分布为:.(3)设表示事件“去餐厅就餐获奖”,表示事件“学生甲午餐去餐厅就餐”,由题知,,,,,则,解得.即如果学生甲并没有抽中奖品,第二天午餐依然在餐厅就餐的概率.【变式3-3】.(24-25高三上·上海松江·阶段练习)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:赔偿次数 0 1 2 3 4单数 800 100 60 30 10假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.(1)估计一份保单索赔次数不少于2的概率;(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.(i)记为一份保单的毛利润,估计的数学期望;(ii)如果无索赔的保单的保费减少4%,有索赔的保单的保费增加20%,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.【答案】(1)(2)(i);(ii)答案见解析【分析】(1)根据题设中的数据可求赔偿次数不少2的概率;(2)(i)设为赔付金额,则可取,用频率估计概率后可求的分布列及数学期望,从而可求;(ii)先算出下一期保费的变化情况,结合(1)的结果可求,从而即可比较大小得解.【解析】(1)设为“随机抽取一单,赔偿不少于2次”,由题设中的统计数据可得:.(2)(i)设为赔付金额,则可取,由题设中的统计数据可得:,,,,,故,故(万元).(ii)由题设保费的变化为,故.【变式3-4】.(23-24高三下·上海青浦·阶段练习)中国首个海外高铁项目——雅万高铁全线长142.3千米,共设有哈利姆站、卡拉旺站、帕达拉朗站、德卡伯尔站4个车站.在运营期间,铁路公司随机选取了100名乘客的乘车记录,统计分析,得到下表(单位:人):下车站上车站 卡拉旺站 帕达拉朗站 德卡鲁尔站 总计哈利姆站 5 20 15 40卡拉旺站 10 20 30帕达拉朗站 30 30总计 5 30 65 100用频率代替概率,根据上表解决下列问题:(1)在运营期间,从卡拉旺站上车的乘客中任选3人,设这3人到德卡鲁尔站下车的人数为随机变量,求的分布列及其数学期望;(2)已知地处在哈利姆站与卡拉旺站之间,地居民到哈利姆站乘车的概率为,到卡拉旺站乘车的概率为(地居民不可能在卡拉旺站下车).在高铁离开卡拉旺站时,求从哈利姆站上车的乘客来自地的概率与从卡拉旺站上车的乘客来自地的概率的比值.【答案】(1)分布列见解析,(2)【分析】(1)首先求出样本中从卡拉旺站上车的乘客到德卡鲁尔站下车的概率,即可得到,根据二项分布的概率公式求出分布列,再计算其期望即可;(2)记事件:该乘客来自地;记事件:该乘客在哈利姆站上车;记事件:该乘客在卡拉旺站上车,依题意得到,,,,再由概率乘法公式得到,从而得到.【解析】(1)从卡拉旺站上车的乘客到德卡鲁尔站下车的概率,根据频率估计概率,从卡拉旺站上车的乘客中任选3人,则这3人到德卡鲁尔站下车的人数,即的可能取值为,,,,所以,,,,所以的分布列如下:0 1 2 3则;(2)由表中数据可知,在高铁离开卡拉旺站时,在哈利姆站上车的有35人,在卡拉旺站上车的有30人.记事件:该乘客来自地;记事件:该乘客在哈利姆站上车;记事件:该乘客在卡拉旺站上车;,,,,从哈利姆站上车的乘客中是来自地的概率为,从卡拉旺站上车的乘客中是来自地的概率为,,,,,,在高铁离开卡拉旺站时,所求概率的比值为.题型04 线性回归及其综合应用【典例4-1】.(2024·上海·一模)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:克每立方米)与样本对原点的距离(单位:米)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中).6 97.90 0.21 240 0.14 14.12 26.13(1)利用相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型;(2)根据(1)的结果建立关于的回归方程,并估计样本对原点的距离米时,平均金属含量是多少?【答案】(1)更适宜作为回归方程类型;(2),.【分析】(1)根据题意,分别求得相关系数的值,结合和,结合,即可得到结论.(2)(i)根据最小二乘法,求得回归系数,进而求得回归方程;(ii)当时,结合回归方程,即可求得预报值.【解析】(1)因为的线性相关系数,的线性相关系数,因为,所以更适宜作为平均金属含量关于样本对原点的距离的回归方程类型.(2)依题意,,则,于是,所以关于的回归方程为.当时,金属含量的预报值为.【典例4-2】.(2023·上海杨浦·模拟预测)某科技公司为确定下一年度投入某种产品的研发费,需了解年研发费x(单位:万元)对年销售量y(单位:百件)和年利润(单位:万元)的影响,现对近6年的年研发费和年销售量(,2,…,6)数据作了初步处理,得到下面的散点图及一些统计量的值. 12.5 222 3.5 157.5 16800 4.5 1254 270表中,.(1)根据散点图判断与哪一个更适宜作为年研发费x的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润,根据(2)的结果,当年研发费为多少时,年利润z的预报值最大?附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计分别为,.【答案】(1);(2);(3)30万元.【分析】(1)由散点图可以判断更适宜作为年研发费x的回归方程类型;(2)令,建立y关于的线性回归方程,再利用最小二乘法求出 y关于μ的线性回归方程即得解;(3)求出,再利用导数求函数的最值得解.【解析】(1)由散点图可以判断更适宜作为年研发费x的回归方程类型.(2)令,所以.,,所以y关于μ的线性回归方程,因此,关于x的回归方程为.(3)由(2)可知,,当时,,函数单调递增;当时,,函数单调递减.所以当研发费为30万元时,年利润z的预报值最大.【变式4-1】.(2023·上海奉贤·一模)某连锁便利店从年到年销售商品品种为种,从年开始,该便利店进行了全面升级,销售商品品种为种.下表中列出了从年到年的利润额.年份利润额 /万元(1)若某年的利润额超过万元,则该便利店当年会被评选为示范店;若利润额不超过万元,则该便利店当年不会被评选为示范店.试完成列联表,并判断商品品种数量与便利店是否为示范店有关?(显著性水平,)品种为种 品种为种 总计被评为示范店次数未被评为示范店次数总计(2)请根据年至年(剔除年的数据)的数据建立与的线性回归模型①;根据年至年的数据建立与的线性回归模型②.分别用这两个模型,预测年该便利店的利润额并说明这样的预测值是否可靠?(回归系数精确到,利润精确到万元)回归系数与的公式如下:【答案】(1)列联表见解析,商品品种的提升与该便利店是否是示范店有关.(2)答案见解析【分析】(1)列出列联表后计算出后,与比较大小即可得;(2)分别计算出线性回归模型后,结合所得数据进行判断即可得.【解析】(1)列联表为品种为种 品种为种 总计被评为示范店次数未被评为示范店次数总计,可以判断商品品种的提升与该便利店是否是示范店有关.(2)线性回归模型①:,,则,则,故,当时,预测值为;线性回归模型②:,,则,,故,当时,预测值为.模型①的预测不可靠,根据(1)可以知道商品品种与便利店的品质有关,影响了利润额,因此按照经济发展规律,应该用比较新的数据即品种为3000种的数据进行预测; 模型②的预测不可靠,2022年可能因为受疫情影响或者其它不可因素,其利润额60.5为异常数据,应该剔除.【变式4-2】.(2024·上海·模拟预测)某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离 56 63 71 79 90 102 110 117损坏零件数(个) 61 73 90 105 119 136 149 163(1)建立关于的回归模型,根据所给数据及回归模型,求回归方程及相关系数.(精确到0.1,精确到1,精确到0.0001)(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?保养 未保养 合计报废 20未报废合计 60 100附:,0.050 0.010 0.0013.841 6.635 10.828【答案】(1),(2)列联表见解析,能认为【分析】(1)利用最小二乘法求出,即可得出回归方程,再根据公式求出相关系数即可;(2)根据题意可将列联表补充完整,根公式求得,再对照临界值表即可得出结论.【解析】(1),,又由,可得,则,所以变量关于的线性回归方程为,,;(2)设零假设为:是否报废与是否保养无关,由题意,报废推进器中保养过的共台,未保养的推进器共台,补充列联表如下:保养 未保养 合计报废 6 14 20未报废 54 26 80合计 60 40 100则,根据小概率值的独立性检验,我们推断不成立,即认为是否报废与保养有关,此推断的错误概率不大于.【变式4-3】.(23-24高三下·上海浦东新·阶段练习)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的的平均浓度(单位:). 调研人员采集了50天的数据,制作了关于的散点图,并用直线与将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.(1)完成下面的列联表,并判断至少有多大把握认为“平均浓度不小于与“汽车日流量不小于1500辆”有关;汽车日流量 汽车日流量 合计的平均浓度的平均浓度合计(2)经计算得回归方程为,且这50天的汽车日流量的标准差,的平均浓度的标准差.①求相关系数,并判断该回归方程是否有价值;②若这50天的汽车日流量满足,试推算这50天的日均浓度的平均数.(精确到0.1)参考公式:,其中.0.100 0.050 0.010 0.0012.706 3.841 6.635 10.828回归方程,其中.相关系数. 若,则认为与有较强的线性相关性.【答案】(1)列联表见解析,至少有的把握;(2)① 0.84,有价值;②【分析】(1)根据题意,完成列联表,再计算,结合表格即可求得结果.(2)代入公式计算可判断与的相关性强弱,由可得,结合回归直线必过样本中心可求得的值.【解析】(1)列联表如下:汽车日流量 汽车日流量 合计的平均浓度 16 8 24的平均浓度 6 20 26合计 22 28 50零假设:“PM2.5平均浓度不小于100μg/m3”与“汽车日流量不小于1500辆”无关,因为,所以至少有的把握(但还不能有的把握)认为“平均浓度不小于”与“汽车日流量不小于1500辆有关”.(2)①因为回归方程为,所以,又因为,,所以.与有较强的相关性,该回归方程有价值.②,解得而样本中心点位于回归直线上,因此可推算.题型05 独立性检验 列联表【典例5-1】.(24-25高三上·上海·期中)学校为了解学生对“公序良俗”的认知情况,设计了一份调查表,题目分为必答题和选答题.其中必答题是①、②、③共三道题,选答题为④、⑤、⑥、⑦、⑧、⑨、⑩共七道题,被调查者在选答题中自主选择其中道题目回答即可.现从④、⑥、⑧、⑩四个题目中至少选答一道的学生中随机抽取名学生进行调查,他们选答④、⑥、⑧、⑩的题目数及人数统计如表:选答④、⑥、⑧、⑩的题目数 1道 2道 3道 4道人数(1)现规定:同时选答④、⑥、⑧、⑩的学生为“公序良俗”达人.学校还调查了这位学生的性别情况,研究男女生中“公序良俗”达人的大概比例,得到的数据如下表:性别 “公序良俗”达人 非“公序良俗”达人 总计男性女性总计请完成上述列联表,并根据小概率值的独立性检验,分析“公序良俗”达人与性别是否有关.(2)从这名学生中任选名,记表示这名学生选答④、⑥、⑧、⑩的题目数之差的绝对值,求随机变量的分布和数学期望.参考公式:,其中.附表见上图.【答案】(1)列联表见解析,有关;(2)分布列见解析,.【分析】(1)根据题意,补全列联表,求得,结合附表,即可得到结论;(2)根据题意,得到随机变量的可能有0,1,2,3,求得相应的概率,列出分布列,结合期望的公式,即可求解.【解析】(1)这100位学生中,“公序良俗”达人有20人,由此补全列联表如下: 性别 “公序良俗”达人 非“公序良俗”达人 总计男性 13 30 43女性 7 50 57总计 20 80 100零假设:“公序良俗”达人与性别无关,可得,所以根据小概率值的独立性检验,我们可推断不成立,即认为“公序良俗”达人与性别有关.(2)由题意,随机变量的可能有,,,,可得,,,,所以的分布列如下:0 1 2 3所以数学期望.【典例5-2】.(24-25高三上·上海·阶段练习)为了了解广大消费者购买新能源汽车意向与年龄是否具有相关性,某汽车APP采用问卷调查形式对400名消费者进行调查,数据显示这400人中中老年人共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍;青年中愿意购买新能源车的人数是愿意购买燃油车的4倍.年龄段 购车意向 合计愿意购买新能源车 愿意购买燃油车青年中老年合计(1)完善2×2列联表,请根据小概率值的独立性检验,分析消费者对新能源车和燃油车的意向购买与年龄是否有关;(2)采用分层随机抽样从愿意购买新能源车的消费者中抽取9人,再从这9人中随机抽取5人,求这5人中青年人数的分布和期望.附:,.0.05 0.01 0.0013.841 6.635 10.828【答案】(1)列联表见解析,有关(2)分布列见解析,【分析】(1)根据题意分别求出愿意购买新能源车的中年人数和青年人数以及愿意购买燃油车中年人数和青年人数,即可补全列联表,再根据公式计算出,根据表格即可判断;(2)先求出抽取9人中青年人数和中年人数,求出青年人数的可能取值及其对应的概率,即可求出分布列,再由数学期望公式即可求解.【解析】(1)中老年共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍,所以愿意购买新能源车的中老年人数为100人,愿意购买燃油车的中老年人数为50人,青年共有250人,愿意购买新能源车是愿意购买燃油车的4倍,所以青年中愿意购买新能源车为200人,愿意购买燃油车为50人,故2×2列联表如下:年龄段 购车意向 合计愿意购买新能源车 愿意购买燃油车青年 200 50 250中老年 100 50 150合计 300 100 400零假设:消费者购买新能源车和燃油车的意向与年龄无关,根据小概率值的独立性检验,我们推断不成立,即认为消费者购买新能源车和燃油车的意向与年龄有关;(2)愿意购买新能源车的共有300人,青年人与中老年人的比例为,所以分层随机抽样抽取的9人中6人是青年人,3人是中老年人,记这5人中,青年的人数为,则的可能取值为,,.所以的分布列如下:X 2 3 4 5P则,所以这5人中青年人数的期望为.【变式5-1】.(24-25高三上·上海·阶段练习)某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生是否同意“三项体育活动中要有篮球”,学校随机调查了名学生,数据如表:男生 女生 合计同意不同意合计(1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关 (2)现有足球、篮球、跳绳供学生选择.若甲、乙两学生从三项运动中随机选一种(他们的选择相互独立).若在甲学生选择足球的前提下,两人的选择不同的概率为.记事件为“甲学生选择足球”,事件为“甲、乙两名学生的选择不同”,判断事件是否独立,并说明理由.(3)经观察,该校学生每分钟跳绳个数,由往年经验,训练后每人每分钟跳绳个数比开始时增加个,该校有名学生,预估经过训练后每分钟跳个以上人数(结果四舍五入到整数).参考公式和数据:,其中;若,则,,.【答案】(1)有的把握认为,学生对该观点的态度与性别有关(2)独立,理由见解析(3)约人【分析】(1)计算出卡方,即可判断;(2)求出,,即可得到,从而得到,即可判断;(3)由已知,经过训练后每人每分钟跳绳个数,根据正态分布的性质求出,从而估计出人数.【解析】(1)提出零假设:学生对该问题的态度与性别无关.根据列联表中的数据可求得,.因为当成立时,的概率约为,所以有的把握认为,学生对该观点的态度与性别有关.(2)事件、独立.理由如下:因为,,所以,所以,即事件、独立.(3)记经过训练后每人每分钟跳绳个数为,由已知,经过训练后每人每分钟跳绳个数,即,因为,所以,所以(人).所以经过训练后该校每分钟跳个以上人数约为.【变式5-2】.(24-25高三上·上海·期中)2024年某瓷器公司计划向市场推出两种高档中国红瓷杯A和,已知A和烧制成功率分别为和,烧制成功一个A,盈利30元,否则亏损10元;烧制成功一个,盈利80元,否则亏损20元.(1)设为烧制一个A和一个所得的利润之和,求随机变量的分布和数学期望;(2)求烧制4个A所得的利润不少于80元的概率;(3)公司将用户对中国红瓷器的喜欢程度分为“非常满意”(得分不低于85分)和“满意”(得分低于85分)两类,通过调查完成下表.年龄低于45岁 6 14 42 31 7年龄不低于45岁 4 6 47 35 8根据调查数据完成下列列联表,并依据显著性水平的独立性检验,判断居民对瓷器的喜欢程度是否与年龄有关联?非常满意 满意 合计年龄低于45岁年龄不低于45岁合计附:,,,与的若干对应数值见下表:0.25 0.05 0.0051.323 3.841 7.879【答案】(1)分布列见详解;元(2)0.8192(3)列联表见解析,居民对瓷器的喜欢程度是否与年龄有关联【分析】(1)分析可知随机变量的可能取值为,结合独立事件概率求法求分布列,进而可得期望;(2)设相应随机变量,分析可知,根据题意可得,结合二项分布运算求解即可;(3)完善列联表,求,并与临界值对比分析即可.【解析】(1)由题意可知:A和烧制成功率分别为0.8和0.9,随机变量的可能取值为,则有:,,所以随机变量的分布列为10 70 1100.02 0.08 0.18 0.72随机变量的期望(元).(2)设烧制4个A成功的件数为,则,设烧制4个A所得的利润为,则,令,解得,所以.(3)根据题意完善列联表可得:非常满意 满意 合计年龄低于45岁 80 20 100年龄不低于45岁 90 10 100合计 30 170 200零假设:居民对瓷器的喜欢程度是否与年龄没有关联,则,依据显著性水平的独立性检验,可知零假设不成立,所以居民对瓷器的喜欢程度是否与年龄有关联.【变式5-3】.(24-25高三上·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活。现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:喜欢网上买菜 不喜欢网上买菜 合计年龄不超过45岁的市民 40 10 50年龄超过45岁的市民 20 30 50合计 60 40 100(1)能否有95%的把握认为社区的市民是否喜欢网上头菜与年龄有关?(2)M社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;(3)用频率估计概率,现从M社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求、的期望和方差.参考公式:,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1)有(2)(3),,,.【分析】(1)计算,利用独立性检验思想进行判断.(2)利用全概率公式进行运算.(3)根据二项分布期望与方差的计算公式求,,在根据变量的线性相关求,.【解析】(1)零假设:M社区的市民是否喜欢网上头菜与年龄无关.由给定的列联表,得:.所以不成立,有有95%的把握认为M社区的市民是否喜欢网上头菜与年龄有关.(2)设表示周在A平台买菜,表示周在B平台买菜,则,由全概率公式,小张周二选择平台买菜的概率为:.(3)依题意,喜欢网上买菜的概率为:.从M社区随机抽取20名市民,其中喜欢网上买菜的市民人数服从二项分布:,所以,.又,所以,.【变式5-4】.(24-25高三·上海·课堂例题)“日行万步”正成为健康生活的代名词.某地一研究团队统计了该地区1000位居民的日行步数,得到如下表格:日行步数(单位:千步)人数(人) 20 60 170 200 300 200 50(1)为研究日行步数与居民年龄的关系,以日行步数是否超过8千步为标准进行分层抽样,从上述1000位居民中抽取200人,得到如下列联表,请将列联表补充完整,并根据2列联表判断是否有95%把握认为日行步数与居民年龄超过40岁有关;日行步数千步 日行步数>8千步 总计40岁以上(人) 10040岁以下(含40岁)(人) 50总计 2000.50 0.40 0.25 0.15 0.010 0.05 0.025 0.0100.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635(2)以这1000位居民日行步数超过8千步的频率,代替该地区1位居民日行步数超过8千的概率,每位居民日行步数是否超过8千相互独立.为了深入研究,该研究团队随机调查了20位居民,其中日行步数超过8千的最有可能(即概率最大)是多少位居民?【答案】(1)列联表见解析,没有(2)【分析】(1)根据表中数据可以将列联表补充完整,进而可以求出卡方值,进而可以判断是否有把握;(2)依题意列出不等式,解不等式即可.【解析】(1)1000人中,步数不超过8千步的有人,超过8千步有550人,按分层抽样,抽取的人数中不超过8千步的有90人,超过8千步的有110人,列联表如下:日行步数千步 日行步数>8千步 总计40岁以上 40 60 10040岁以下(含40岁) 50 50 100总计 90 110 200零假设 日行步数与居民年龄超过40岁无关..故没有95%把握认为日行步数与居民年龄超过40岁有关;(2)每位居民步数超过8千的概率为,设步数超过8千的最有可能是位居民,所以所以,因为,所以,即最有可能是11位居民.【变式5-5】.(2024·上海徐汇·二模)为了解中草药甲对某疾病的预防效果,研究人员随机调查了100名人员,调查数据如表.(单位:个)未患病者 患病者 合计未服用 中草药甲服用 中草药甲合计(1)若规定显著性水平,试分析中草药甲对预防此疾病是否有效;(2)已知中草药乙对该疾病的治疗有效率数据如下:对未服用过中草药甲的患者治疗有效率为,对服用过中草药甲的患者治疗有效率为.若用频率估计概率,现从患此疾病的人员中随机选取2人(分两次选取,每次1人,两次选取的结果独立)使用中草药乙进行治疗,记治疗有效的人数为,求的分布和数学期望.附:,.0.100 0.050 0.010 0.0012.706 3.841 6.635 10.828【答案】(1)认为中草药甲对预防此疾病有效果(2)分布列见解析,期望为【分析】(1)计算出卡方,即可判断;(2)记表示服用中草药乙后治疗有效,表示未服用过中草药甲,表示服用过中草药甲,利用全概率公式求出,依题意可得,根据二项分布的概率公式求出所对应的概率,即可得到分布列与数学期望.【解析】(1)提出原假设:中草药甲对预防此疾病无效,确定显著性水平,计算,而,的值超过了所确定的界限,从而否定原假设,即认为中草药甲对预防此疾病有效果.(2)记表示服用中草药乙后治疗有效,表示未服用过中草药甲,表示服用过中草药甲,由题意可得,,且,,则,即中草药乙的治疗有效率,则,所以,,,所以随机变量的分布为:0 1 2所以随机变量的数学期望.题型06 函数的实际应用与统计概率综合【典例6-1】.(2023·上海金山·二模)某网站计划4月份订购草莓在网络销售,每天的进货量相同,成本价为每盒15元.假设当天进货能全部售完,决定每晚七点前(含七点)售价为每盒20元,每晚七点后售价为每盒10元.根据销售经验,每天晚七点前的购买量与网站每天的浏览量(单位:万次)有关.为确定草莓的进货量,相关人员统计了前两年4月份(共60天)网站每天的浏览量(单位:万次)、晚七点前购买草莓的数量(单位:盒)以及达到该流量的天数,如下表所示:每天的浏览量每天晚七点前的购买量 300 900天数 36 24以每天的浏览量位于各区间的频率代替浏览量位于该区间的概率.(1)求4月份草莓一天晚七点前的购买量(单位:盒)的分布;(2)设4月份销售草莓一天的利润为(单位:元),一天的进货量为(单位:盒),为正整数且,当为多少时,的期望达到最大值,并求此最大值.【答案】(1)分布列见解析(2)当时的期望达到最大值,.【分析】(1)依题意的可能取值为、,求出所对应的概率,即可得到概率分布列;(2)依题意可得的可能取值为或,求出所对应的概率,即可得到【解析】(1)依题意的可能取值为、,则,,所以的分布列为(2)当一天的进货量为(单位:盒),为正整数且时利润的可能取值为或,且,,所以,显然随着的增大而减少,所以当时的期望达到最大值,.【变式6-1】.(2023·上海长宁·二模)某地新能源汽车保有量符合阻沛型增长模型,其中为自统计之日起,经过t年后该地新能源汽车保有量、和r为增长系数、M为饱和量.下表是该地近6年年底的新能源汽车的保有量(万辆)的统计数据:年份 2018 2019 2020 2021 2022t 0 1 2 3 4保有量 9.6 12.9 17.1 23.2 31.4假设该地新能源汽车饱和量万辆.(1)若,假设2018年数据满足公式,计算的值(精确到0.01)并估算2023年年底该地新能源汽车保有量(精确到0.1万辆);(2)设,则与t线性相关.请依据以上表格中相关数据,利用线性回归分析确定和r的值(精确到0.01).附:线性回归方程中回归系数计算公式如下:.【答案】(1),万辆(2),【分析】(1)根据题意代入即可求出,代入利用公式估算即可得解;(2)设设,转化为关于的线性回归问题,利用公式求出即可.【解析】(1)由题意可知,2018年对应,,满足,所以,解得,因为年对应的,所以所以估计2023年底该地新能源汽车保有量为40.3万辆.(2),设,则,t 0 1 2 3 49.6 12.9 17.1 23.2 31.43.37 3.07 2.77 2.44 2.11,,,所以,因为,所以.(该题无参考数据,需要计算器计算)【变式6-2】.(2023·上海浦东新·模拟预测)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中)6 60(1)利用样本相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?(2)根据(1)的结果回答下列问题:(i)建立关于的回归方程;(ii)样本对原点的距离时,金属含量的预报值是多少?(3)已知该金属在距离原点米时的平均开采成本(单位:元)与关系为,根据(2)的结果回答,为何值时,开采成本最大?【答案】(1)(2)(i);(ii)(3)10【分析】(1)根据所给数据求出相对应的相关系数,即可判断;(2)(i)由(1)及所给数据求出、,即可得到回归方程;(ii)将代入计算即可;(3)依题意,可得,令,利用导数求出函数的单调性,即可求出函数的极大值点,从而得解.【解析】(1)因为的线性相关系数,的线性相关系数,,更适宜作为平均金属含量关于样本对原点的距离的回归方程类型.(2)(i)依题意,可得,,,关于的回归方程为.(ii)当时,金属含量的预报值为.(3)因为,令,则,当时,,在上单调递增;当时,,在上单调递减,在处取得极大值,也是最大值,此时取得最大值,故为10时,开采成本最大.【变式6-3】.(2023·上海松江·二模)某城市响应国家号召,积极调整能源结构,推出多种价位的新能源电动汽车.根据前期市场调研,有购买新能源车需求的约有2万人,他们的选择意向统计如下:车型 A B C D E F价格 9万元 12万元 18万元 24万元 30万元 40万元占比 5% 15% 25% 35% 15% 5%(1)如果有购车需求的这些人今年都购买了新能源车,今年新能源车的销售额预计约为多少亿元?(2)车企推出两种付款方式:全款购车:购车时一次性付款可优惠车价的3%;分期付款:无价格优惠,购车时先付车价的一半,余下的每半年付一次,分4次付完,每次付车价的.①某位顾客现有a万元现金,欲购买价值a万元的某款车,付款后剩余的资金全部用于购买半年期的理财产品(该理财产品半年期到期收益率为1.8%),到期后,可用资金(含理财收益)继续购买半年期的理财产品,问:顾客选择哪一种付款方式收益更多?(计算结果精确到0.0001)②为了激励购买理财产品,银行对采用分期付款方式的顾客,赠送价值1888元的大礼包,试问:这一措施对哪些车型有效?(计算结果精确到0.0001)【答案】(1)亿元(2)①顾客选择全款购车方式收益更多.②这一措施对购买 车型有效.【分析】(1) 先计算销售一辆车的价格的数学期望,再计算,即可得今年新能源车的销售额预计;(2) ①先计算全款购车两年后资产总额和分期付款购车两年后资产总额则为顾客选择全款购车方式收益更多.; ②由①得,可得措施对购买 车型有效.【解析】(1)销售一辆车的价格的数学期望为:(万元)(亿)所以,今年新能源车的销售额预计约为亿元(2)①全款购车两年后资产总额为: (万元).分期付款购车两年后资产总额为:(万元)因为,所以顾客选择全款购车方式收益更多.②由①得:,所以 .所以,这一措施对购买 车型有效.一、解答题1.(2023·上海普陀·一模)我国随着人口老龄化程度的加剧,劳动力人口在不断减少,“延迟退休”已成为公众关注的热点话题之一,为了了解公众对“延迟退休”的态度,某研究机构对属地所在的一社区进行了调查,并将随机抽取的50名被调查者的年龄制成如图所示的茎叶图.(1)经统计发现,投赞成票的人均年龄恰好是这50人年龄的第60百分位数,求此百分位数;(2)经统计年龄在的被调查者中,投赞成票的男性有3人,女性有2人,现从该组被调查者中随机选取男女各2人进行跟踪调查,求被选中的4人中至少有3人投赞成票的概率(结果用最简分数表示)【答案】(1)44.5(2)【分析】(1)求出指数,再根据百分位数的求法即可;(2)利用组合公式结合古典概型即可得到答案.【解析】(1)由条件得,指数,则这50人年龄的第60百分位数是将他们的年龄按从小到大的顺序排列后的第30人与第31人的年龄平均值,由茎叶图可知,第30人的年龄为44,第31人的年龄为45,则所求的第60百分位数是44.5.(2)由茎叶图可知,年龄在的被调查者共9人,其中6名男性,3名女性,令为至少有三人投赞成票,依题意得,被选中的4人中有两名女性一名男性投赞成票的概率是被选中的4人中有一名女性两名男性投赞成票的概率是,被选中的4人中有两名女性两名男性投赞成票的概率是,则被选中的4人中至少有3人投赞成票的概率为.2.(2024·上海徐汇·一模)某企业招聘员工,指定“英语听说” “信息技术” “逻辑推理”作为三门考试课程,有两种考试方案.方案一:参加三门课程的考试,至少有两门及格为通过;方案二:在三门课程中,随机选取两门,并参加这两门课程的考试,两门都及格为通过.假设某应聘者参加三门指定课程考试及格的概率分别是.,且三门课程考试是否及格相互之间没有影响.(1)分别求该应聘者选方案一考试通过的概率和选方案二考试通过的概率;(2)试比较该应聘者在上述两种方案下考试通过的概率的大小,并说明理由.【答案】(1);(2),理由见解析【分析】(1)记该应聘者对三门指定课程考试及格的事件分别为,方案一即可表示为,方案二先考虑随机选取两门的概率为,再计算这两门都及格的概率即可.(2)为了比较概率大小,可作差与比较即可.【解析】(1)记该应聘者对三门指定课程考试及格的事件分别为,则.应聘者选方案一考试通过的概率应聘者选方案二考试通过的概率(2),因为,所以,即.故,即选方案一,该应聘者考试通过的概率较大.3.(2024·上海奉贤·三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:假设1:各回合比赛相互独立;假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?【答案】(1)(2)不合理,理由见详解【分析】(1)由全概率公式,即可求解;(2)由已知条件,求出第一回合发球者在整场比赛中先得第一分的概率,与比较,即可得到答案.【解析】(1)设事件表示第一回合该中国队运动员赢球,事件表示第二回合该中国队运动员赢球,事件表示第二回合比赛有运动员得分,由已知,, ,则,即第二回合比赛有运动员得分的概率为.(2)设运动员甲先发球,记事件表示第i回合该运动员甲赢球,记事件表示运动员甲先得第一分,则,则,所以,即则第一回合发球者在整场比赛中先得第一分的概率大于,则比赛双方运动员实力相当的情况下,先发球者更大概率占据心理上的优势,所以旧制不合理.4.(2024·上海·模拟预测)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:时间范围学业成绩优秀 5 44 42 3 1不优秀 134 147 137 40 27(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?(附:其中,.)【答案】(1)(2)(3)有【分析】(1)求出相关占比,乘以总人数即可;(2)根据平均数的计算公式即可得到答案;(3)作出列联表,再提出零假设,计算卡方值和临界值比较大小即可得到结论.【解析】(1)由表可知锻炼时长不少于1小时的人数为占比,则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为.(2)估计该地区初中生的日均体育锻炼时长约为.则估计该地区初中学生日均体育锻炼的时长为0.9小时.(3)由题列联表如下:其他 合计优秀 45 50 95不优秀 177 308 485合计 222 358 580提出零假设:该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关.其中..则零假设不成立,即有的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关.5.(2024·上海·三模)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成,,九组,绘制成如图所示的频率分布直方图.(1)现认为大于10小时的公益劳动时间为长,小于10小时的公益劳动时间为短,填写下列列联表,并判断是否有95%把握认为公益劳动时间与学生性别有关.性别 公益劳动时间 合计长 短男 110女 120合计(2)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在内的学生人数为,求的分布列和期望;(3)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“”表示这20名学生中恰有名学生参加公益劳动时间在](单位:小时)内的概率,其中.当最大时,写出的值.0.100 0.050 0.025 0.0102.706 3.841 5.024 6.635【答案】(1)表格见解析,没有95%的把握认为公益劳动时间与学生性别有关(2)分布列见解析,(3)【分析】(1)根据频率分布直方图利用频率之和为1求解,再列表计算卡方得解;(2)分层抽样后,根据题意的可能取值为0,1,2,3,求出概率列出分布列和期望即可;(3)根据独立重复试验概率公式得出不等式组,解不等式得解.【解析】(1)由频率分布直方图得:,解得 由频率分布直方图可得大于10小时的人数为,填表如下性别 公益劳动时间 合计长 短男 110 180 290女 90 120 210合计 200 300 500①提出原假设H0:认为公益劳动时间与学生性别无关②确定显著性水平:③计算: ④无法否定原假设⑤结论:没有95%的把握认为公益劳动时间与学生性别有关(2)这500名学生中参加公益劳动时间在三组内的学生人数分别为:人,人,人,若采用分层抽样的方法抽取了10人,则从参加公益劳动时间在内的学生中抽取:人,现从这10人中随机抽取3人,则的可能取值为0,1,2,3,的分布列为: 0 1 2 3则其期望为(3)由(2)可知参加公益劳动时间在的概率所以依题意,即,即,解得因为为非负整数,所以,即当最大时,6.(2024·上海·三模)为了解人们是否喜欢跑步,某机构在一小区随机抽取了40人进行调查,统计结果如下表.喜欢 不喜欢 合计男 12 8 20女 10 10 20合计 22 18 40(1)根据以上数据,判断能否有95%的把握认为人们对跑步的喜欢情况与性别有关?附:,其中,(2)该小区居民张先生每天跑步或开车上班,据以往经验,张先生跑步上班准时到公司的概率为,张先生跑步上班迟到的概率为.对于下周(周一~周五)上班方式张先生作出如下安排:周一跑步上班,从周二开始,若前一天准时到公司,当天就继续跑步上班,否则,当天就开车上班,且因公司安排,周五开车去公司(无论周四是否准时到达公司).设从周一开始到张先生第一次开车去上班前跑步上班的天数为X,求X的分布列及数学期望.【答案】(1)没有95%的把握认为人们对跑步的喜欢情况与性别有关(2)分布列见解析;期望为【分析】(1)根据列联表计算出,再与临界值进行比较,即可得出结论;(2)根据题意分析可能的取值,并依次求得概率,得到X的分布列,进而求得X的数学期望.【解析】(1)由题意,零假设:人们对跑步的喜欢情况与性别无关,则,故不能认为零假设不成立,所以没有95%的把握认为人们对跑步的喜欢情况与性别有关.(2)由题意,所有可能的取值分别为,,,,,,,,所以X的分布列为:1 2 3 4所以.7.(2024·上海·三模)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期,一研究团队在当地感染某一种传染病的人群中随机抽取了200名患者,其中潜伏期超过5天的患者人数为80.(1)为了研究这200名患者中潜伏期超过5天的群体与不超过5天的群体的性别是否有显著性差异,该团队将患者按性别分成两组进行对比,人数分布如下表所示:潜伏期≤5天 潜伏期>5天 总计男 67 34 101女 53 46 99总计 120 80 200请根据表中数据,判断这两类人群的性别有无显著性差异(显著性水平),并说明理由;(附:,其中,)(2)为了进一步深化研究,该团队拟在当地随机抽取名患者开展个案分析.现用200名患者中潜伏期超过5天的频率值,作为“从当地随机抽取一名患者,其潜伏期超过5天”的概率的估计值.若该团队希望事件“这n名患者中,至少有2人的潜伏期超过5天”发生的概率不低于0.9,同时为了保障个案分析的质量,考虑到时间与成本的制约,希望抽取的患者数尽可能少,则该团队应该抽取多少名患者 【答案】(1)无显著差异(2)9【分析】(1)根据题中列联表,计算值并根据其与的大小比较得出结论;(2)由题意分析出随机变量服从二项分布,利用对立事件的概率,求出所求概率,建立不等式,解不等式即可得解.【解析】(1)零假设:潜伏期超过5天的群体与不超过5天的群体的性别没有显著性差异.根据列联表数据计算可得:3.414<3.841=根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为潜伏期超过5天的群体与不超过5天的群体的性别没有显著性差异;(2)由题可知,从当地随机抽取一名患者,其潜伏期超过5天的概率为,设n名患者中潜伏期超过5天的人数为,则服从二项分布:,令事件A:n名患者中,至少有2人的潜伏期超过5天,,由题意可知,,即,解不等式得,,所以根据抽取的患者数尽可能少的原则,该团队应该抽取9名患者.8.(2024·上海·三模)某市举行了一次大型宣传活动,会后组办方分别从7个不同的地方的问卷调查中各随机抽取了相同数量的数据构成一个样本,依据相关的标准该样本中各地抽取的数据人均得分构成数列,且,由各地的得分可以认为各地人均得分2服从正态分布,近似为抽取的样本中7个地方人均得分的平均值(得分的平均值四舍五入并取整数).(1)利用正态分布的知识求;(2)组办方为此次参加问卷调查的市民制定如下两种奖励方案:方案一:(i)得分不低于的可以获赠2次随机话费,得分低于的可以获赠1次随机话费;(ii)每次获赠的随机话费和对应的概率为获赠的随机话费(单位:元) 50 100概率方案二:参加了此次问卷调查的市民可获得价值100元的“元旦迎新”大型晚会活动入场券,参加了此次问卷调查的市民可选择其中一种奖励方案.①市民小李参加了此次问卷调查,记X(单位:元)为小李参加问卷调查获赠的话费,求X的分布列及数学期望;②请问小李是选择参加获赠随机话费活动,还是获得价值100元的参加“元旦迎新”入场券?请用统计中相关知识为小李作出决策.(附:若,则,,)【答案】(1)0.8186(2)分布列见解析,;选择获得价值100元的“元旦迎新”入场卷更好,理由见解析【分析】(1)先求出7个地方的人均得分,进而,利用原则和正态曲线的性质计算即可求解;(2)①可能的取值为元,利用独立事件的乘法公式求出对应的概率,列出分布列,求出数学期望即可;②由①知,即可下结论.【解析】(1)样本中各地的人均得分分别为,所以7个地方的平均分为,即,所以.,,所以;(2)①:由题意,得出的话费可能的取值为元,得50元的情况为低于平均值,概率为;得100元的情况为有1次机会获得100或2次机会获得50元,概率为;得150元的情况为有1次机会获得100和1次机会获得50元,概率为;得200元的情况为有2次机会都获得100元,概率为,所以的分布列为:50 100 150 200故;②:由①知,所以小李应选择获得价值100元的“元旦迎新”入场卷更好.21世纪教育网(www.21cnjy.com)21世纪教育网(www.21cnjy.com)21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源列表 2025年高考数学二轮热点题型归纳与演练(上海专用)专题04统计与概率(六大题型)(原卷版).docx 2025年高考数学二轮热点题型归纳与演练(上海专用)专题04统计与概率(六大题型)(解析版).docx