资源简介 第7节 概率与统计的综合问题(时间:45分钟,满分:60分)1.(13分)某校为了落实“双减”政策,安排了25名教师参与课后服务工作,在某个星期内,他们参与课后服务的次数统计如图所示.(1)求这25名教师在该星期参与课后服务的平均次数;(2)从这25名教师中任选2人,设这2人在该星期参与课后服务的次数之差的绝对值为X,求X的分布列与数学期望.2.(15分)(2026·浙江衢州、丽水、湖州模拟)某校举办定点投篮挑战赛,规则如下:每位参赛同学可在A,B两点进行投篮,共投两次.第一次投篮点可在A,B两点处随机选择一处,若投中,则第二次投篮点不变;若未投中,则第二次切换投篮点.在A点投中得2分,在B点投中得3分,未投中均得0分,各次投中与否相互独立.(1)在参赛的同学中,随机调查50名的得分情况,得到如下2×2列联表:得分≥3分 得分<3分 合计先在A点投篮 20 5 25先在B点投篮 10 15 25合计 30 20 50是否有99%的把握认为投篮得分与第一次投篮点的选择有关?(2)小明在A点投中的概率为0.7,在B点投中的概率为0.3.①求小明第一次投中的概率;②记小明投篮总得分为X,求X的分布列及数学期望.3.(15分)某基地蔬菜大棚采用无土栽培的方式种植各类蔬菜.根据过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图.(1)依据折线图,是否可用线性回归模型拟合y与x的关系?请计算样本相关系数r并加以说明(精确到0.01);(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量 X/小时 30<X<50 50≤X≤70 X>70光照控制仪最 多可运行台数 3 2 1若某台光照控制仪运行,则该台光照控制仪周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?参考数据:≈0.55,≈0.95.4.(17分)(2026·河南郑州模拟)某企业对某品牌芯片开发了一条生产线进行试产.其芯片按质量划分为五个等级,分别对应如下五组质量指标值:[45,55),[55,65),[65,75),[75,85),[85,95].根据长期检测结果,得到芯片的质量指标值X服从正态分布N(μ,σ2),并把质量指标值不小于80的产品称为A等品,其他产品称为B等品.现从该品牌芯片的生产线中随机抽取100件作为样本,统计得到如图所示的频率分布直方图.(1)根据长期检测结果,该芯片质量指标值的标准差s的近似值为11,用样本平均数作为μ的近似值,用样本标准差s作为σ的估计值.若从生产线中任取一件芯片,试估计该芯片为A等品的概率(保留小数点后面两位有效数字);(2)①从样本的质量指标值在[45,55)和[85,95]的芯片中随机抽取3件,记其中质量指标值在[85,95]的芯片件数为η,求η的分布列和数学期望;②该企业为节省检测成本,采用随机混装的方式将所有的芯片按100件一箱包装.已知一件A等品芯片的利润是m(1<m<24)元,一件B等品芯片的利润是ln(25-m)元,根据(1)的计算结果,试求m的值,使得每箱产品的利润最大.第7节 概率与统计的综合问题1.解:(1)由统计图可知,25名教师中,参与课后服务2次的有4人,参与课后服务3次的有5人,参与课后服务4次的有10人,参与课后服务5次的有6人,所以这25名教师在该星期参与课后服务的平均次数为=3.72.(2)由题可知,X的所有可能取值为0,1,2,3,P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==,所以X的分布列为X 0 1 2 3P所以X的数学期望E(X)=0×+1×+2×+3×=.2.解:(1)零假设为H0:得分与第一次投篮点选择独立,即得分无差异χ2==>6.635,根据小概率值α=0.01的独立性检验,我们推断H0不成立,因此认为得分与第一次投篮点选择有关联,此推断犯错误的概率不超过0.01.(2)设第1次选择在点A投篮记为事件A,在点B投篮记为事件B,投中记为事件E,则P(A)=,P(B)=,P(E|A)=0.7,P(E|B)=0.3.①P(E)=P(EA)+P(EB)=P(A)·P(E|A)+P(B)·P(E|B)=,所以小明第一次投篮命中的概率为0.5.②小明投篮总得分X可取0,2,3,4,6,则P(X=0)=××+××=,P(X=2)=××+××=,P(X=3)=××+××=,P(X=4)=××=,P(X=6)=××=.所以X的分布列为X 0 2 3 4 6P所以E(X)=0×+2×+3×+4×+6×=.3.解:(1)由已知数据可得==5,==4.因为(xi-)(yi-)=(-3)×(-1)+0+0+0+3×1=6,==2,==.所以样本相关系数r===≈0.95.因为r>0.75,所以可用线性回归模型拟合y与x的关系.(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪.①安装1台光照控制仪可获得周总利润3 000元.②安装2台光照控制仪的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=3 000-1 000=2 000(元),P(Y=2 000)==0.2,当30<X≤70时,2台光照控制仪都运行,此时周总利润Y=2×3 000=6 000(元),P(Y=6 000)==0.8,故Y的分布列为Y 2 000 6 000P 0.2 0.8所以E(Y)=2 000×0.2+6 000×0.8=5 200(元).③安装3台光照控制仪的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=1×3 000-2×1 000=1 000(元),P(Y=1 000)==0.2,当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3 000-1×1 000=5 000(元),P(Y=5 000)==0.7,当30<X<50时,3台光照控制仪都运行,周总利润Y=3×3 000=9 000(元),P(Y=9 000)==0.1,故Y的分布列为Y 1 000 5 000 9 000P 0.2 0.7 0.1所以E(Y)=1 000×0.2+5 000×0.7+9 000×0.1=4 600(元).综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪.4.解:(1)由题意,估计从该品牌芯片的生产线中随机抽取100件的质量指标值的平均数为:=10×(0.01×50+0.025×60+0.04×70+0.015×80+0.01×90)=69.即μ≈=69,σ≈s≈11,所以X~N(69,112),所以P(X≥80)==≈=0.158 65≈0.16,所以从生产线中任取一件芯片,该芯片为A等品的概率约为0.16.(2)①(0.01+0.01)×10×100=20,所以所取样本的个数为20,质量指标值在[85,95]的芯片件数为10件,故η可能取的值为0,1,2,3,则P(η=0)==,P(η=1)==,P(η=2)==,P(η=3)==,随机变量η的分布列为η 0 1 2 3P所以η的数学期望E(η)=0×+1×+2×+3×=.②设每箱产品中A等品有Y件,则每箱产品中B等品有(100-Y)件,设每箱产品的利润为Z元,由题意知,Z=mY+(100-Y)ln(25-m)=(m-ln(25-m))Y+100ln(25-m),由(1)知每箱产品中A等品的概率为0.16,所以Y~B(100,0.16),所以E(Y)=100×0.16=16,所以E(Z)=E[(m-ln(25-m))Y+100ln(25-m)]=(m-ln(25-m))E(Y)+100ln(25-m)=16(m-ln(25-m))+100ln(25-m)=16m+84ln(25-m).令f(x)=16x+84ln(25-x)(1<x<24),由f'(x)=16-=0得,x=,又x∈(1,)时,f'(x)>0,f(x)单调递增,x∈(,24)时,f'(x)<0,f(x)单调递减,所以当x=时,f(x)取得最大值.所以当m=时,每箱产品利润最大.1 / 1第7节 概率与统计的综合问题 概率与统计的综合问题是命制生活实践情境类试题的最佳切入点,所考查内容涉及数据分析、数学建模、数学运算、逻辑推理等核心素养,是近几年高考追逐的热点之一,处理此类问题的关键是把握概率、统计的本质,合理构造模型,正确进行数学运算和必要的逻辑推理. 统计图表与概率的综合问题(师生共研过关)(2022·新高考Ⅱ卷19题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1).统计图表与概率综合问题的求解策略 (1)正确识读统计图表,从图表中提取有效信息及样本数据; (2)根据统计原理即用样本数字特征估计总体的思想,结合样本中各统计量之间的关系构造数学模型(函数模型、不等式模型、二项分布模型、超几何分布模型或正态分布模型等); (3)正确进行运算,求出样本数据中能够说明问题的特征值,从而用此数据估计总体或作出科学的决策与判断.训练1 〔一题多解〕(2024·北京高考18题)某保险公司为了解该公司某种保险产品的索赔情况,从合同保险期限届满的保单中随机抽取1 000份,记录并整理这些保单的索赔情况,获得数据如下表:索赔次数 0 1 2 3 4保单份数 800 100 60 30 10假设:一份保单的保费为0.4万元;前三次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.(1)估计一份保单索赔次数不少于2的概率;(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.①记X为一份保单的毛利润,估计X的数学期望EX;②如果无索赔的保单的保费减少4%,有索赔的保单的保费增加20%,试比较这种情况下一份保单毛利润的数学期望估计值与①中EX估计值的大小.(结论不要求证明)回归分析与概率的综合问题(师生共研过关)近年来,我国大学生毕业人数呈逐年上升趋势,各省市出台优惠政策鼓励高校毕业生自主创业,以创业带动就业.某市统计了该市其中四所大学2026年毕业生人数及自主创业人数(单位:千人),得到下表:A大学 B大学 C大学 D大学2026年毕业生人数x/千人 3 4 5 6自主创业人数y/千人 0.1 0.2 0.4 0.5(1)已知y与x具有较强的线性相关关系,求y关于x的经验回归方程=+x;(2)假设该市政府对选择自主创业的大学生每人发放1万元的创业补贴.①若该市E大学2026年毕业生人数为7千人,根据(1)的结论估计该市政府要给E大学选择自主创业的毕业生发放创业补贴的总金额;②若A大学的毕业生中小明、小红选择自主创业的概率分别为p,2p-1( <p<1),该市政府对小明、小红两人的自主创业的补贴总金额的期望不超过1.4万元,求p的取值范围.参考公式及参考数据:=,=-,xiyi=6.1,=86.回归分析与概率综合问题的解题思路 (1)此类问题的特点为:同一生活实践情境下设计两类问题,即:①求经验回归方程(预测);②求某随机变量的概率(范围)、均值、方差等; (2)充分利用题目中提供的成对样本数据(散点图)做出判断,确定是线性问题还是非线性问题.求解时要充分利用已知数据,合理利用变形公式,以达到快速准确运算的目的; (3)明确所求问题所属事件的类型,准确构建概率模型.训练2 (2026·江苏南通模拟)当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:关卡x 1 2 3 4 5 6平均过关时间y(单位:秒) 50 78 124 121 137 352计算得到一些统计量的值为:ui=28.5,xiui=106.05,其中ui=ln yi.参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),其经验回归直线=x+的斜率和截距的最小二乘估计分别为=,=-.(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y关于x的经验回归方程;(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获得-1分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为,若甲玩一轮此款益脑游戏,求“甲获得的积分X”的分布列和数学期望.独立性检验与概率(师生共研过关)(2023·全国甲卷19题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;(2)试验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2 18.8 20.2 21.3 22.5 23.2 25.826.5 27.5 30.1 32.6 34.3 34.8 35.635.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为:7.80 9.20 11.4 12.4 13.2 15.5 16.518.0 18.8 19.2 19.8 20.2 21.6 22.823.6 23.9 25.1 28.2 32.3 36.5①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:<m ≥m对照组试验组②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:K2=,P(K2≥k) 0.100 0.050 0.010k 2.706 3.841 6.635.独立性检验与概率综合问题的解题思路 解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后进行比较,其次再按照随机变量满足的概率模型求解.训练3 (2026·海南海口模拟)在春节联欢晚会上进行了机器人团体舞蹈表演,某机构随机抽取了100名观众进行问卷调查,得到了如下数据:喜欢 不喜欢男性 40 10女性 20 30(1)依据α=0.001的独立性检验,试分析对机器人表演节目的喜欢是否与性别有关联?(2)从这100名样本观众中任选1名,设事件A=“选到的观众是男性”,事件B=“选到的观众喜欢机器人团体舞蹈表演节目”,比较P(B|A)和P(B|)的大小,并解释其意义.第7节 概率与统计的综合问题考点1【例1】 解:(1)估计该地区这种疾病患者的平均年龄=10×(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)=47.9.(2)由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,且相互独立,所以所求概率P=1-(0.001+0.002+0.006+0.002)×10=0.89.(3)设从该地区任选一人,年龄位于区间[40,50)为事件A,患这种疾病为事件B,则P(A)=16%,由频率分布直方图知这种疾病患者年龄位于区间[40,50)的概率为0.023×10=0.23,结合该地区这种疾病的患病率为0.1%,可得P(AB)=0.1%×0.23=0.000 23,所以从该地区任选一人,若年龄位于区间[40,50),则此人患这种疾病的概率为P(B|A)==≈0.001 4.训练1 解:(1)法一 记“随机抽取一份保单,索赔次数不少于2”为事件A,由索赔次数不少于2,知索赔次数为2,3,4,所以P(A)===.法二 记“随机抽取一份保单,索赔次数不少于2”为事件A,由索赔次数不少于2,知可利用间接法计算,则P(A)=1-=.(2)①由题知X的所有可能取值为0.4,-0.4,-1.2,-2.0,-2.6,则P(X=0.4)==0.8,P(X=-0.4)==0.1,P(X=-1.2)==0.06,P(X=-2.0)==0.03,P(X=-2.6)==0.01.故EX=0.4×0.8-0.4×0.1-1.2×0.06-2.0×0.03-2.6×0.01=0.122.②如果无索赔的保单的保费减少4%,有索赔的保单的保费增加20%,这种情况下一份保单毛利润的数学期望估计值比①中EX估计值大.证明如下:设调整保费后一份保单的毛利润(单位:万元)为Y,对于索赔次数为0的保单,Y=0.4×(1-4%)=0.384,对于索赔次数为1的保单,Y=0.4×(1+20%)-0.8=-0.32,对于索赔次数为2的保单,Y=-0.32-0.8=-1.12,对于索赔次数为3的保单,Y=-1.12-0.8=-1.92,对于索赔次数为4的保单,Y=-1.92-0.6=-2.52,故EY=0.384×0.8-0.32×0.1-1.12×0.06-1.92×0.03-2.52×0.01=0.125 2.所以EX<EY.考点2【例2】 解:(1)由题意得==4.5,==0.3,===0.14,所以=-=0.3-0.14×4.5=-0.33.故y关于x的经验回归方程为=0.14x-0.33.(2)①将x=7代入得,=0.14×7-0.33=0.65,所以估计该市政府需要给E大学选择自主创业的毕业生发放创业补贴的总金额为0.65×1 000×1=650(万元).②设小明、小红两人中选择自主创业的人数为X,则X的所有可能取值为0,1,2,P(X=0)=(1-p)(2-2p)=2p2-4p+2,P(X=1)=(1-p)(2p-1)+p(2-2p)=-4p2+5p-1,P(X=2)=p(2p-1)=2p2-p,则E(X)=(2p2-4p+2)×0+(-4p2+5p-1)×1+(2p2-p)×2=3p-1≤1.4,p≤.因为<p<1,所以<p≤,故p的取值范围为(,].训练2 解:(1)对y=aebx两边取自然对数可得ln y=ln(aebx)=ln a+ln ebx,即ln y=ln a+bx,令ui=ln yi,所以u=bx+ln a,由=ui=4.75,=×(1+2+3+4+5+6)=3.5,=12+22+32+42+52+62=91.所以===0.36,又=+ln ,即4.75=0.36×3.5+ln ,所以ln =3.49,所以=e3.49.所以y关于x的经验回归方程为=e0.36x+3.49.(2)由题知,甲获得的积分X的所有可能取值为5,7,9,12,所以P(X=5)=,P(X=7)=×=,P(X=9)=()2×=,P(X=12)=()3=,所以X的分布列为X 5 7 9 12P所以E(X)=5×+7×+9×+12×=.考点3【例3】 解:(1)X的所有可能取值为0,1,2,且P(X=i)=,i=0,1,2,所以X的分布列为X 0 1 2PX的数学期望E(X)=0×+1×+2×=1.(2)①根据试验数据可知40只小白鼠体重增加量的中位数m==23.4.列联表如下:<m ≥m对照组 6 14试验组 14 6②根据①中结果可得K2==6.4>3.841,所以有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.训练3 解:(1)零假设H0:对机器人表演节目的喜欢与性别无关.根据列联表中的数据得χ2==≈16.667>10.828=x0.001,依据α=0.001的独立性检验,可以推断H0不成立,即对机器人表演节目的喜欢与性别有关联.(2)依题意得,P(B|A)===,P(B|)===,则P(B|A)>P(B|).意义:该样本中男性对机器人团体舞蹈表演节目喜欢的概率比女性对机器人团体舞蹈表演节目喜欢概率大;或者男性对机器人团体舞蹈表演节目喜欢的人数比女性对机器人团体舞蹈表演节目喜欢的人数多等等.1 / 1(共57张PPT)第7节 概率与统计的综合问题重难解读 概率与统计的综合问题是命制生活实践情境类试题的最佳切入点,所考查内容涉及数据分析、数学建模、数学运算、逻辑推理等核心素养,是近几年高考追逐的热点之一,处理此类问题的关键是把握概率、统计的本质,合理构造模型,正确进行数学运算和必要的逻辑推理.统计图表与概率的综合问题(师生共研过关)(2022·新高考Ⅱ卷19题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);解: 估计该地区这种疾病患者的平均年龄 =10×(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)=47.9.(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;解:由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,且相互独立,所以所求概率P=1-(0.001+0.002+0.006+0.002)×10=0.89.(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1).解:设从该地区任选一人,年龄位于区间[40,50)为事件A,患这种疾病为事件B,则P(A)=16%,由频率分布直方图知这种疾病患者年龄位于区间[40,50)的概率为0.023×10=0.23,结合该地区这种疾病的患病率为0.1%,可得P(AB)=0.1%×0.23=0.000 23,所以从该地区任选一人,若年龄位于区间[40,50),则此人患这种疾病的概率为P(B|A)= = ≈0.001 4.统计图表与概率综合问题的求解策略(1)正确识读统计图表,从图表中提取有效信息及样本数据;(2)根据统计原理即用样本数字特征估计总体的思想,结合样本中各统计量之间的关系构造数学模型(函数模型、不等式模型、二项分布模型、超几何分布模型或正态分布模型等);(3)正确进行运算,求出样本数据中能够说明问题的特征值,从而用此数据估计总体或作出科学的决策与判断.训练1 〔一题多解〕(2024·北京高考18题)某保险公司为了解该公司某种保险产品的索赔情况,从合同保险期限届满的保单中随机抽取1 000份,记录并整理这些保单的索赔情况,获得数据如下表:索赔次数 0 1 2 3 4保单份数 800 100 60 30 10假设:一份保单的保费为0.4万元;前三次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.(1)估计一份保单索赔次数不少于2的概率;解: 法一 记“随机抽取一份保单,索赔次数不少于2”为事件A,由索赔次数不少于2,知索赔次数为2,3,4,所以P(A)= = = .法二 记“随机抽取一份保单,索赔次数不少于2”为事件A,由索赔次数不少于2,知可利用间接法计算,则P(A)=1- = .(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.①记X为一份保单的毛利润,估计X的数学期望EX;②如果无索赔的保单的保费减少4%,有索赔的保单的保费增加20%,试比较这种情况下一份保单毛利润的数学期望估计值与①中EX估计值的大小.(结论不要求证明)解:①由题知X的所有可能取值为0.4,-0.4,-1.2,-2.0,-2.6,则P(X=0.4)= =0.8,P(X=-0.4)= =0.1,P(X=-1.2)= =0.06,P(X=-2.0)= =0.03,P(X=-2.6)= =0.01.故EX=0.4×0.8-0.4×0.1-1.2×0.06-2.0×0.03-2.6×0.01=0.122.②如果无索赔的保单的保费减少4%,有索赔的保单的保费增加20%,这种情况下一份保单毛利润的数学期望估计值比①中EX估计值大.证明如下:设调整保费后一份保单的毛利润(单位:万元)为Y,对于索赔次数为0的保单,Y=0.4×(1-4%)=0.384,对于索赔次数为1的保单,Y=0.4×(1+20%)-0.8=-0.32,对于索赔次数为2的保单,Y=-0.32-0.8=-1.12,对于索赔次数为3的保单,Y=-1.12-0.8=-1.92,对于索赔次数为4的保单,Y=-1.92-0.6=-2.52,故EY=0.384×0.8-0.32×0.1-1.12×0.06-1.92×0.03-2.52×0.01=0.125 2.所以EX<EY.回归分析与概率的综合问题(师生共研过关)近年来,我国大学生毕业人数呈逐年上升趋势,各省市出台优惠政策鼓励高校毕业生自主创业,以创业带动就业.某市统计了该市其中四所大学2026年毕业生人数及自主创业人数(单位:千人),得到下表:A大学 B大学 C大学 D大学2026年毕业生 人数x/千人 3 4 5 6自主创业人数 y/千人 0.1 0.2 0.4 0.5(1)已知y与x具有较强的线性相关关系,求y关于x的经验回归方程 =+ x;解: 由题意得 = =4.5, = =0.3,= = =0.14,所以 = - =0.3-0.14×4.5=-0.33.故y关于x的经验回归方程为 =0.14x-0.33.①若该市E大学2026年毕业生人数为7千人,根据(1)的结论估计该市政府要给E大学选择自主创业的毕业生发放创业补贴的总金额;②若A大学的毕业生中小明、小红选择自主创业的概率分别为p,2p-1( <p<1),该市政府对小明、小红两人的自主创业的补贴总金额的期望不超过1.4万元,求p的取值范围.(2)假设该市政府对选择自主创业的大学生每人发放1万元的创业补贴.参考公式及参考数据: = , = - , xiyi=6.1,=86.解:①将x=7代入得, =0.14×7-0.33=0.65,所以估计该市政府需要给E大学选择自主创业的毕业生发放创业补贴的总金额为0.65×1 000×1=650(万元).②设小明、小红两人中选择自主创业的人数为X,则X的所有可能取值为0,1,2,P(X=0)=(1-p)(2-2p)=2p2-4p+2,P(X=1)=(1-p)(2p-1)+p(2-2p)=-4p2+5p-1,P(X=2)=p(2p-1)=2p2-p,则E(X)=(2p2-4p+2)×0+(-4p2+5p-1)×1+(2p2-p)×2=3p-1≤1.4,p≤ .因为 <p<1,所以 <p≤ ,故p的取值范围为( , ].回归分析与概率综合问题的解题思路(1)此类问题的特点为:同一生活实践情境下设计两类问题,即:①求经验回归方程(预测);②求某随机变量的概率(范围)、均值、方差等;(2)充分利用题目中提供的成对样本数据(散点图)做出判断,确定是线性问题还是非线性问题.求解时要充分利用已知数据,合理利用变形公式,以达到快速准确运算的目的;(3)明确所求问题所属事件的类型,准确构建概率模型.训练2 (2026·江苏南通模拟)当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:关卡x 1 2 3 4 5 6平均过关时间y(单位:秒) 50 78 124 121 137 352计算得到一些统计量的值为: ui=28.5, xiui=106.05,其中ui=ln yi.参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),其经验回归直线 = x+ 的斜率和截距的最小二乘估计分别为 = ,= - .(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y关于x的经验回归方程;解: 对y=aebx两边取自然对数可得ln y=ln(aebx)=ln a+ln ebx,即lny=ln a+bx,令ui=ln yi,所以u=bx+ln a,由 = ui=4.75,= ×(1+2+3+4+5+6)=3.5, =12+22+32+42+52+62=91.所以 = = =0.36,又 = +ln ,即4.75=0.36×3.5+ln ,所以ln =3.49,所以 =e3.49.所以y关于x的经验回归方程为 =e0.36x+3.49.(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获得-1分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为 ,若甲玩一轮此款益脑游戏,求“甲获得的积分X”的分布列和数学期望.解:由题知,甲获得的积分X的所有可能取值为5,7,9,12,所以P(X=5)= ,P(X=7)= × = ,P(X=9)=( )2× = ,P(X=12)=( )3= ,X 5 7 9 12P 所以E(X)=5× +7× +9× +12× = .所以X的分布列为独立性检验与概率(师生共研过关)(2023·全国甲卷19题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;解: X的所有可能取值为0,1,2,且P(X=i)= ,i=0,1,2,所以X的分布列为X 0 1 2P X的数学期望E(X)=0× +1× +2× =1.(2)试验结果如下:对照组的小白鼠体重的增加量从小到大排序为:试验组的小白鼠体重的增加量从小到大排序为:①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:<m ≥m对照组试验组②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:K2= ,P(K2≥k) 0.100 0.050 0.010k 2.706 3.841 6.635.解: ①根据试验数据可知40只小白鼠体重增加量的中位数m==23.4.列联表如下:<m ≥m对照组 6 14试验组 14 6②根据①中结果可得K2= =6.4>3.841,所以有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.独立性检验与概率综合问题的解题思路 解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后进行比较,其次再按照随机变量满足的概率模型求解.训练3 (2026·海南海口模拟)在春节联欢晚会上进行了机器人团体舞蹈表演,某机构随机抽取了100名观众进行问卷调查,得到了如下数据:喜欢 不喜欢男性 40 10女性 20 30(1)依据α=0.001的独立性检验,试分析对机器人表演节目的喜欢是否与性别有关联?解: 零假设H0:对机器人表演节目的喜欢与性别无关.根据列联表中的数据得χ2= = ≈16.667>10.828=x0.001,依据α=0.001的独立性检验,可以推断H0不成立,即对机器人表演节目的喜欢与性别有关联.(2)从这100名样本观众中任选1名,设事件A=“选到的观众是男性”,事件B=“选到的观众喜欢机器人团体舞蹈表演节目”,比较P(B|A)和P(B| )的大小,并解释其意义.解:依题意得,P(B|A)= = = ,P(B| )== = ,则P(B|A)>P(B| ).意义:该样本中男性对机器人团体舞蹈表演节目喜欢的概率比女性对机器人团体舞蹈表演节目喜欢概率大;或者男性对机器人团体舞蹈表演节目喜欢的人数比女性对机器人团体舞蹈表演节目喜欢的人数多等等.课时跟踪检测(时间:45分钟,满分:60分)1. (13分)某校为了落实“双减”政策,安排了25名教师参与课后服务工作,在某个星期内,他们参与课后服务的次数统计如图所示.(1)求这25名教师在该星期参与课后服务的平均次数;解: 由统计图可知,25名教师中,参与课后服务2次的有4人,参与课后服务3次的有5人,参与课后服务4次的有10人,参与课后服务5次的有6人,所以这25名教师在该星期参与课后服务的平均次数为 =3.72.1234(2)从这25名教师中任选2人,设这2人在该星期参与课后服务的次数之差的绝对值为X,求X的分布列与数学期望.解: 由题可知,X的所有可能取值为0,1,2,3,P(X=0)= = ,P(X=1)= = ,P(X=2)= = ,P(X=3)= = ,1234X 0 1 2 3P 所以X的数学期望E(X)=0× +1× +2× +3× = .所以X的分布列为12342. (15分)(2026·浙江衢州、丽水、湖州模拟)某校举办定点投篮挑战赛,规则如下:每位参赛同学可在A,B两点进行投篮,共投两次.第一次投篮点可在A,B两点处随机选择一处,若投中,则第二次投篮点不变;若未投中,则第二次切换投篮点.在A点投中得2分,在B点投中得3分,未投中均得0分,各次投中与否相互独立.(1)在参赛的同学中,随机调查50名的得分情况,得到如下2×2列联表:得分≥3分 得分<3分 合计先在A点投篮 20 5 25先在B点投篮 10 15 25合计 30 20 501234解: 零假设为H0:得分与第一次投篮点选择独立,即得分无差异χ2= = >6.635,根据小概率值α=0.01的独立性检验,我们推断H0不成立,因此认为得分与第一次投篮点选择有关联,此推断犯错误的概率不超过0.01.是否有99%的把握认为投篮得分与第一次投篮点的选择有关?1234①求小明第一次投中的概率;②记小明投篮总得分为X,求X的分布列及数学期望.解: 设第1次选择在点A投篮记为事件A,在点B投篮记为事件B,投中记为事件E,则P(A)= ,P(B)= ,P(E|A)=0.7,P(E|B)=0.3.①P(E)=P(EA)+P(EB)=P(A)·P(E|A)+P(B)·P(E|B)= ,所以小明第一次投篮命中的概率为0.5.②小明投篮总得分X可取0,2,3,4,6,则(2)小明在A点投中的概率为0.7,在B点投中的概率为0.3.1234P(X=0)= × × + × × = ,P(X=2)= × × + × × = ,P(X=3)= × × + × × = ,P(X=4)= × × = ,P(X=6)= × × = .所以X的分布列为X 0 2 3 4 6P 所以E(X)=0× +2× +3× +4× +6× = .12343. (15分)某基地蔬菜大棚采用无土栽培的方式种植各类蔬菜.根据过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图.(1)依据折线图,是否可用线性回归模型拟合y与x的关系?请计算样本相关系数r并加以说明(精确到0.01);(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)1234解: 由已知数据可得 = =5,= =4.因为 (xi- )(yi- )=(-3)×(-1)+0+0+0+3×1=6,==2 ,1234= = .所以样本相关系数r= = = ≈0.95.因为r>0.75,所以可用线性回归模型拟合y与x的关系.1234(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量X/小时 30<X<50 50≤X≤70 X>70光照控制仪最 多可运行台数 3 2 1若某台光照控制仪运行,则该台光照控制仪周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?参考数据: ≈0.55, ≈0.95.1234解: 记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪.①安装1台光照控制仪可获得周总利润3 000元.②安装2台光照控制仪的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=3 000-1 000=2 000(元),P(Y=2000)= =0.2,1234当30<X≤70时,2台光照控制仪都运行,此时周总利润Y=2×3 000=6000(元),P(Y=6 000)= =0.8,故Y的分布列为Y 2 000 6 000P 0.2 0.81234所以E(Y)=2 000×0.2+6 000×0.8=5 200(元).③安装3台光照控制仪的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=1×3 000-2×1000=1 000(元),P(Y=1 000)= =0.2,当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3 000-1×1 000=5 000(元),P(Y=5 000)= =0.7,1234当30<X<50时,3台光照控制仪都运行,周总利润Y=3×3 000=9 000(元),P(Y=9 000)= =0.1,故Y的分布列为Y 1 000 5 000 9 000P 0.2 0.7 0.1所以E(Y)=1 000×0.2+5 000×0.7+9 000×0.1=4 600(元).综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪.12344. (17分)(2026·河南郑州模拟)某企业对某品牌芯片开发了一条生产线进行试产.其芯片按质量划分为五个等级,分别对应如下五组质量指标值:[45,55),[55,65),[65,75),[75,85),[85,95].根据长期检测结果,得到芯片的质量指标值X服从正态分布N(μ,σ2),并把质量指标值不小于80的产品称为A等品,其他产品称为B等品.现从该品牌芯片的生产线中随机抽取100件作为样本,统计得到如图所示的频率分布直方图.1234(1)根据长期检测结果,该芯片质量指标值的标准差s的近似值为11,用样本平均数 作为μ的近似值,用样本标准差s作为σ的估计值.若从生产线中任取一件芯片,试估计该芯片为A等品的概率(保留小数点后面两位有效数字);1234解: 由题意,估计从该品牌芯片的生产线中随机抽取100件的质量指标值的平均数为:=10×(0.01×50+0.025×60+0.04×70+0.015×80+0.01×90)=69.即μ≈ =69,σ≈s≈11,所以X~N(69,112),所以P(X≥80)= =≈ =0.158 65≈0.16,所以从生产线中任取一件芯片,该芯片为A等品的概率约为0.16.1234(2)①从样本的质量指标值在[45,55)和[85,95]的芯片中随机抽取3件,记其中质量指标值在[85,95]的芯片件数为η,求η的分布列和数学期望;②该企业为节省检测成本,采用随机混装的方式将所有的芯片按100件一箱包装.已知一件A等品芯片的利润是m(1<m<24)元,一件B等品芯片的利润是ln(25-m)元,根据(1)的计算结果,试求m的值,使得每箱产品的利润最大.1234解: ①(0.01+0.01)×10×100=20,所以所取样本的个数为20,质量指标值在[85,95]的芯片件数为10件,故η可能取的值为0,1,2,3,则P(η=0)= = ,P(η=1)= = ,P(η=2)= = ,P(η=3)= = ,随机变量η的分布列为η 0 1 2 3P 所以η的数学期望E(η)=0× +1× +2× +3× = .1234②设每箱产品中A等品有Y件,则每箱产品中B等品有(100-Y)件,设每箱产品的利润为Z元,由题意知,Z=mY+(100-Y)ln(25-m)=(m-ln(25-m))Y+100ln(25-m),由(1)知每箱产品中A等品的概率为0.16,所以Y~B(100,0.16),所以E(Y)=100×0.16=16,所以E(Z)=E[(m-ln(25-m))Y+100ln(25-m)]=(m-ln(25-m))E(Y)+100ln(25-m)=16(m-ln(25-m))+100ln(25-m)1234=16m+84ln(25-m).令f(x)=16x+84ln(25-x)(1<x<24),由f'(x)=16- =0得,x= ,又x∈(1, )时,f'(x)>0,f(x)单调递增,x∈( ,24)时,f'(x)<0,f(x)单调递减,所以当x= 时,f(x)取得最大值.所以当m= 时,每箱产品利润最大.1234THANKS演示完毕 感谢观看 展开更多...... 收起↑ 资源列表 第7节 概率与统计的综合问题.docx 第7节 概率与统计的综合问题.pptx 第7节 概率与统计的综合问题(练习,含解析).docx