资源简介 培优课 统计案例与概率1.对三组数据进行统计,获得以下散点图,其相关系数依次是r1,r2,r3,则它们的大小关系是( )A.r1>r3>r2 B.r1>r2>r3C.r2>r1>r3 D.r3>r1>r22.已知变量X和变量Y的线性相关系数为r1,变量U和变量V的线性相关系数为r2,且r1=0.785,r2=-0.983,则( )A.X和Y之间呈正线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度B.X和Y之间呈负线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度C.U和V之间呈负线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度D.U和V之间呈正线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度3.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日用电量与当天平均气温,如下表:气温x(℃) 18 13 10 -1用电量y(度) 24 34 38 64由表中数据得到线性回归方程为=-2x+,当气温为-4 ℃时,预测用电量为( )A.68度 B.67度C.66度 D.52度4.我国古代劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……为了验证“日落云里走,雨在半夜后”,某兴趣小组观察了所在地区100天的日落和夜晚天气,得到列联表如表所示,计算得到χ2≈19.05.下列判断不正确的是( )日落云里走 夜晚天气下雨 未下雨出现 25 5未出现 25 45A.夜晚下雨的概率约为B.当未出现“日落云里走”时,夜晚下雨的概率约为C.有99%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.若出现“日落云里走”,则有99%的把握认为夜晚会下雨5.已知x,y是两个具有线性相关关系的变量,其取值如下表:x 1 2 3 4 5y 4 m 9 n 11其回归直线=x+过点(3,7)的一个充分不必要条件是( )A.m=n=5 B.m=n=6C.m+n=11 D.m=5,n=66.如图是一组实验数据的散点图,拟合方程y=+c(x>0),令t=,则y关于t的回归直线过点(2,5),(12,25),则当y∈(1.01,1.02)时,x的取值范围是( )A.(0.01,0.02) B.(50,100)C.(0.02,0.04) D.(100,200)7.(多选)下列说法中正确的是( )A.回归直线=x+恒过样本点的中心(,),且至少过一个样本点B.两个变量相关性越强,则相关系数|r|就越接近1C.某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差s2<2D.在线性回归方程=2-0.5x中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位8.(多选)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用x(万元)与销售利润y(万元)的统计数据,如下表,由表中数据,得回归直线l:=x+,则下列结论正确的是( )广告费用x/万元 3 4 6 7销售利润y/万元 6 8 10 12A.>0 B.=2C.直线l必过点(5,9) D.直线l必过点(3,6)9.(多选)针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的,女生中喜欢航天的人数占女生人数的,若有95%的把握认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数可能为( )A.25 B.45 C.60 D.7510.已知x与y之间的几组数据如下表所示:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则 b', a'(填“>”或“<”).11.某省从2021年开始全面推行新高考制度,新高考“3+1+2”中的“1”要求考生从物理、历史中选一科,为了解学生选历史、物理与性别的关系,现随机抽取50名学生,得到结果如下表:性别 科目物理 历史男 13 10女 7 20则我们有 的把握判断选历史、物理与性别有关系.12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为=-20x+.若在这些样本点中任取一点,则它在回归直线左下方的概率为 .单价x(元) 8 8.2 8.4 8.6 8.8 9销量y(件) 90 84 83 80 75 6813.某企业年研发费用x(百万元)与企业年利润y(百万元)之间具有线性相关关系,该企业近5年的年研发费用和年利润的具体数据如下表:年研发费用 x(百万元) 1 2 3 4 5年利润y(百万元) 2 3 4 4 7(1)求y关于x的线性回归方程;(2)如果该企业某年研发费用投入8百万元,预测该企业获得的年利润为多少?参考公式:线性回归方程=x+的斜率和截距的最小二乘法公式分别为:=,=-.参考数据:=4,xiyi=71,=55.14.2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表:性别 天文爱好情况天文爱好者 非天文爱好者 总计女 20 50男 15总计 100附:χ2=,其中n=a+b+c+d.(1)将上表中的数据填写完整,并判断能否有99%的把握认为“天文爱好者”或“非天文爱好者”与性别有关?(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层随机抽样抽取5人,然后再从这5人中随机选出3人,求其中至少有1人是“天文爱好者”的概率.15.学校为了进一步加快推进学生素质教育,丰富学生的课余生活,挖掘学生的动手动脑潜力,在高一年级进行了一次“变废为宝”手工作品评比,对参赛作品进行统计得到如下统计表:性别 作品是否合格不合格 合格 总计男生 120 100 220女生 30 50 80总计 150 150 300(1)运用独立性检验的思想方法判断:能否有99%以上的把握认为性别与作品是否合格有关联?并说明理由;(2)学校为了鼓励更多的同学参与到“变废为宝”活动中来,决定通过3轮挑战赛评选出一些“手工达人”,3轮挑战结束后,至少2次挑战成功的参赛者被评为本学期的“手工达人”.已知某参赛者挑战第一、二、三轮成功的概率分别为,,,求该参赛者在本学期3轮挑战中成功的次数X的分布列及数学期望EX.参考公式:χ2=,n=a+b+c+d.16.当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:关卡x 1 2 3 4 5 6平均过关时间 y(单位:秒) 50 78 124 121 137 352计算得到一些统计量的值为:ui=28.5,xiui=106.05,其中,ui=ln yi.参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),其线性回归方程为=x+,=,=-.(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y与x的回归方程;(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获得-1分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为,若甲玩一轮此款益脑游戏,求“甲获得的积分X”的分布列和数学期望.培优课 统计案例与概率1.A 由散点图可知,图①两个变量成正相关,且线性相关性较强,故r1>0.75,图②两个变量成负相关,且线性相关性较强,故r2<-0.75,图③两个变量线性相关性较弱,故|r3|<0.75,所以r1>r3>r2,故选A.2.C ∵r1=0.785>0,r2=-0.983<0,∴X和Y之间呈正线性相关关系,U和V之间呈负线性相关关系,又|r2|>|r1|,∴X和Y的线性相关程度弱于U和V的线性相关程度,故选C.3.A 由表中数据可知:==10,==40,因为线性回归方程为=-2x+过样本中心点,所以=60,所以当x=-4时,=-2x+60=-2×(-4)+60=68,故选A.4.D 由频率估计概率得,夜晚下雨的概率约为,故A正确;当未出现“日落云里走”时,夜晚下雨的概率约为,故B正确;由χ2≈19.05>6.635得,有99%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C正确,D错误.故选D.5.D 若回归直线=x+过点(3,7),由题知xi=15,=3,故(3,7)为样本中心点,所以4+m+9+n+11=35,m+n=11,所以m+n=11的一个充分不必要条件可以是m=5,n=6.故选D.6.D 根据题意可得y=bt+c(t>0),由y关于t的回归直线过点(2,5),(12,25)可得:所以b=2,c=1,所以y=2t+1,由y∈(1.01,1.02)可得1.01<2t+1<1.02,所以0.005<t<0.01,所以0.005<<0.01,所以100<x<200,故选D.7.BCD A选项,回归直线=x+恒过样本的中心点(,),可以不过任一个样本点,A错;B选项,根据相关系数的意义,可得两个变量相关性越强,则相关系数|r|就越接近1,B对;C选项,根据平均数的计算公式可得==4,根据方差的计算公式s2=[7×2+(4-4)2]=1.75<2,C对;D选项,根据回归系数的含义,可得在线性回归方程=2-0.5x中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位,D对,故选B、C、D.8.ABC 由表格数据得==5,==9,所以直线l必过点(5,9),而===1.4,将(5,9)代入直线方程得9=1.4×5+,解得=2,故选A、B、C.9.BCD 设男生的人数为5n(n∈N+),根据题意列出2×2列联表如下所示:是否喜欢航天 性别男生 女生 总计喜欢航天 4n 3n 7n不喜欢航天 n 2n 3n总计 5n 5n 10n则χ2==,∵有95%的把握认为是否喜欢航天与学生性别有关,∴χ2>3.841,即>3.841,得n>8.066 1,∴5n>40.330 5,又n∈N+,∴结合选项知B、C、D正确.故选B、C、D.10.< > 解析:由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,b'=2,a'=-2.而利用表格中的数据,可求得===,=-=-×=-,所以<b',>a'.11.95% 解析:根据表中数据,得到χ2=≈4.844>3.841,所以我们有95%的把握判断选历史、物理与性别有关系.12. 解析:由表格知:==8.5,==80,所以-20×8.5+=80,可得=250,故=-20x+250,各单价对应预测值如下:单价x(元) 8 8.2 8.4 8.6 8.8 9销量y(件) 90 86 82 78 74 70所以在回归直线左下方的样本点有(8.2,84),(9,68)两个,故概率为.13.解:(1)依题意,==3,又=4,xiyi=71,=55,则===1.1,=-=4-1.1×3=0.7,所以y关于x的线性回归方程为=1.1x+0.7.(2)由(1)知,当x=8时,=1.1×8+0.7=9.5,所以当该企业某年研发费用投入8百万元时,预测该企业获得的年利润为9.5百万元.14.解:(1)性别 天文爱好情况天文爱好者 非天文爱好者 总计女 20 30 50男 35 15 50总计 55 45 100χ2==≈9.091>6.635,故能有99%的把握认为“天文爱好者”或“非天文爱好者”与性别有关.(2)因为抽取的女性人群中,“天文爱好者”和“非天文爱好者”这两种类型人数比为20∶30=2∶3,故按分层随机抽样抽取的5人中:2名为“天文爱好者”,编号为a、b;3名为“非天文爱好者”,编号为1、2、3,则从这5人中随机选出3人,所有可能结果如下:ab1,ab2,ab3,a12,a13,a23,b12,b13,b23,123,共10种情况,其中至少有1人是“天文爱好者”的有9种,所以概率为.15.解:(1)由题意可得χ2=≈6.818>6.635,所以有99%的把握认为性别与作品是否合格有关.(2)X的所有可能值分别为0,1,2,3.P(X=0)=××=,P(X=1)=××+××+××=,P(X=2)=××+××+××=,P(X=3)=××=.故X的分布列为X 0 1 2 3PEX=0×+1×+2×+3×=.16.解:(1)y=aebx两边取对数可得ln y=ln (aebx)=ln a+ln ebx,即ln y=ln a+bx,令ui=ln yi,所以u=bx+ln a,由=ui=4.75,=(1+2+3+4+5+6)=3.5,=12+22+32+42+52+62=91.所以===0.36,又=+ln a,即4.75=0.36×3.5+ln a,所以ln a=3.49,所以a=e3.49.所以y关于x的回归方程为y=e0.36x+3.49.(2)由题知,甲获得的积分X的所有可能取值为5,7,9,12,所以P(X=5)=,P(X=7)=×=,P(X=9)=×=,P(X=12)==,所以X的分布列为X 5 7 9 12P所以EX=5×+7×+9×+12×=.4 / 4 统计案例与概率题型一 回归分析与概率的综合【例1】 某企业研发了一种新药,为评估药物对目标适应症患者的治疗作用和安全性,需要开展临床用药试验,检测显示临床疗效评价指标A的数量y与连续用药天数x具有相关关系.随机征集了一部分志愿者作为样本参加临床用药试验,并得到了一组数据(xi,yi),i=1,2,3,4,5,其中xi表示连续用药i天,yi表示相应的临床疗效评价指标A的数值.根据临床经验,刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓.经计算得到如下一些统计量的值:yi≈62,=47,ui≈4.79,(ui-)2≈1.615,(ui-)(yi-)≈19.38,其中ui=ln xi.(1)试判断y=a+bx与y=a+bln x哪一个适宜作为y关于x的回归方程类型?并建立y关于x的回归方程;(2)新药经过临床试验后,企业决定通过两条不同的生产线每天8小时批量生产该商品,其中第1条生产线的生产效率是第2条生产线的两倍.若第1条生产线出现不合格药品的概率为0.012,第2条生产线出现不合格药品的概率为0.009,两条生产线是否出现不合格药品相互独立.①随机抽取一件该企业生产的药品,求该药品不合格的概率;②若在抽查中发现不合格药品,求该药品来自第1条生产线的概率.参考公式:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其线性回归方程为=+x,=,=-.尝试解答通性通法1.高考常将回归模型与分布列等交汇在一起进行考查,求解时注意概率模型的应用,明确所求问题所属的事件类型是关键.2.在两个变量的回归分析中要注意以下两点:(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算;(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.【跟踪训练】教育部印发的《义务教育课程方案和课程标准(2022年版)》指出,自2022年秋季开始,劳动课将成为中小学一门独立课程.消息一出,“中小学生学做饭”等相关话题引发大量网友关注,儿童厨具也迅速走红.这类儿童厨具并不是指传统意义上的“过家家”,而是真锅真铲真炉灶,能让孩子煎炒烹炸,把饭菜做熟了吃下肚的“真煮”儿童厨具.一家厨具批发商从2022年5月22日起,每10天就对“真煮”儿童厨具的销量统计一次,得到相关数据如下表所示.时间 5月22~5月31日 6月1~6月10日 6月11~6月20日 6月21~6月30日时间 代码x 1 2 3 4销量 y/千件 9.4 9.6 9.9 10.1时间 7月1~ 7月10日 7月11~ 7月20日 7月21~ 7月30日时间 代码x 5 6 7销量 y/千件 10.6 11.1 11.4(1)从这7次统计数据中随机抽取2次,求这2次的销量之和超过21千件的概率;(2)根据表中数据,判断y与x是否具有线性相关关系?若具有,试求出y关于x的线性回归方程;若不具有,请说明理由.(结果保留两位小数)附:线性回归方程为=x+,=,=-,相关系数r=,≈24.51.题型二 独立性检验与概率的综合【例2】 第24届冬季奥林匹克运动会在北京和张家口举行,某研究机构为了了解大学生对冰壶运动的兴趣,随机从某大学生中抽取了120人进行调查,经统计男生与女生的人数比为11∶13,男生中有30人表示对冰壶运动有兴趣,女生中有15人对冰壶运动没有兴趣.(1)根据上面数据列出2×2列联表,并判断能否有99%的把握认为“对冰壶运动是否有兴趣与性别有关”?(2)用分层随机抽样的方法从样本中对冰壶运动有兴趣的学生中抽取8人,求抽取的男生和女生分别为多少人?若从这8人中选取两人作为冰壶运动的宣传员,求选取的2人中恰好有1位男生和1位女生的概率.附:χ2=,其中n=a+b+c+d.尝试解答通性通法 概率与统计案例的结合是近几年高考的热点,解决这类问题的关键是独立性检验问题,关键是过好两关:(1)公式关:把相关数据代入独立性检验公式求χ2;(2)对比关:将求出的χ2观测值与临界值比对,作出准确判断.【跟踪训练】新生儿的某种疾病要接种三次疫苗进行免疫,假设三次接种之间互不影响,每人每次接种成功的概率相等.为了解新生儿该疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:10 μg/次剂量组与20 μg/次剂量组,接种三次后的试验结果如下:接种方案 结果接种成功 接种不成功 总计10 μg/次剂量组 900 100 1 00020 μg/次剂量组 973 27 1 000总计 1 873 127 2 000(1)根据数据说明哪种接种方案效果好,并依据独立性检验中χ2值,判断能否有99%的把握认为该疫苗是否接种成功与接种方案有关;(2)以频率代替概率,若选用接种效果好的方案,参与该试验的1 000人此剂量接种三次的成功人数比只接种一次的成功人数平均提高多少?培优课 统计案例与概率【典型例题·精研析】【例1】 解:(1)刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓,故y=a+bln x适宜作为y关于x的回归方程类型.令u=ln x,得y=a+bu,于是=≈=12,因为ui≈4.79,yi≈62,所以=0.958,=12.4,所以=-·=12.4-0.958×12=0.904,=0.904+12u,即=0.904+12ln x.(2)①设A表示“随机抽取一件该企业生产的药品为不合格药品”,B1表示“随机抽取一件药品为第1条生产线生产”,B2表示“随机抽取一件药品为第2条生产线生产”,则P(B1)=,P(B2)=,又P(A|B1)=0.012,P(A|B2)=0.009,于是P(A)=P[A∩(B1∪B2)]=P(AB1∪AB2)=P(AB1)+P(AB2)=P(B1)P(A|B1)+P(B2)P(A|B2)=×0.012+×0.009=0.011.②P(B1|A)====.跟踪训练 解:(1)从7次统计数据中任意选取2次有=21种选法,其中满足条件的有(9.9,11.4),(10.1,11.1),(10.1,11.4),(10.6,11.1),(10.6,11.4),(11.1,11.4),共6种,所以所求概率P==.(2)由表格数据,得==4,==10.3,所以=(-3)×(-0.9)+(-2)×(-0.7)+(-1)×(-0.4)+0×(-0.2)+1×0.3+2×0.8+3×1.1=9.7,=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,=(9.4-10.3)2+(9.6-10.3)2+(9.9-10.3)2+(10.1-10.3)2+(10.6-10.3)2+(11.1-10.3)2+(11.4-10.3)2=3.44,所以相关系数r==≈0.99.因为相关系数r≈0.99,接近1,所以y与x具有线性相关关系,且正相关性很强.因为==≈0.35,所以=-≈10.3-0.35×4=8.90,所以y关于x的线性回归方程为=0.35x+8.90.【例2】 解:(1)根据题意列出2×2列联表如下:性别 对冰壶运动是否有兴趣有兴趣 没有兴趣 总计男 30 25 55女 50 15 65总计 80 40 120所以χ2=≈6.713>6.635,所以有99%的把握认为“对冰壶运动是否有兴趣与性别有关”.(2)对冰壶运动有兴趣的学生共有80人,从中抽取8人,抽取的男生、女生分别为30×=3(人),50×=5(人).设3位男生为a,b,c,5位女生为A,B,C,D,E.则从中选取2人的样本空间包含的样本点为:ab,ac,aA,aB,aC,aD,aE,bc,bA,bB,bC,bD,bE,cA,cB,cC,cD,cE,AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共28个,其中恰好有1位男生和1位女生的样本点为aA,aB,aC,aD,aE,bA,bB,bC,bD,bE,cA,cB,cC,cD,cE,共15个.所以选取的2人中恰有1位男生和1位女生的概率为P=.跟踪训练 解:(1)由于两种接种方案都是1 000人接受临床试验,10 μg/次剂量组接种成功的人数为900,20 μg/次剂量组接种成功的人数为973,973>900,所以20 μg/次剂量组接种方案效果好.由χ2=≈44.806>6.635,所以我们有99%的把握认为该疫苗是否接种成功与接种方案有关.(2)设20 μg/次剂量组临床试验接种一次成功的概率为p,由数据可知,三次接种成功的概率为=0.973,不成功的概率为=0.027,由于三次接种之间互不影响,每人每次接种成功的概率相等,所以(1-p)3=0.027,得p=0.7,则参与试验的1 000人此剂量只接种一次的成功人数为1 000×0.7=700,又973-700=273,所以选用20 μg/次剂量组接种方案,参与该试验的1 000人此剂量接种三次的成功人数比只接种一次的成功人数平均提高273.3 / 3(共77张PPT)培优课 统计案例与概率目录典型例题·精研析01知能演练·扣课标02典型例题·精研析01课堂互动 关键能力提升题型一 回归分析与概率的综合【例1】 某企业研发了一种新药,为评估药物对目标适应症患者的治疗作用和安全性,需要开展临床用药试验,检测显示临床疗效评价指标 A 的数量 y 与连续用药天数 x 具有相关关系.随机征集了一部分志愿者作为样本参加临床用药试验,并得到了一组数据( xi , yi ), i =1,2,3,4,5,其中 xi 表示连续用药 i 天, yi 表示相应的临床疗效评价指标 A 的数值.根据临床经验,刚开始用药时,指标 A 的数量 y 变化明显,随着天数增加, y 的变化趋缓.经计算得到如下一些统计量的值: yi ≈62, =47, ui ≈4.79, ( ui - )2≈1.615, ( ui - )( yi - )≈19.38,其中 ui =ln xi .(1)试判断 y = a + bx 与 y = a + b ln x 哪一个适宜作为 y 关于 x 的回归方程类型?并建立 y 关于 x 的回归方程;解:刚开始用药时,指标 A 的数量 y 变化明显,随着天数增加, y 的变化趋缓,故 y = a + b ln x 适宜作为 y 关于 x 的回归方程类型.令 u =ln x ,得 y = a + bu ,于是 = ≈ =12,因为 ui ≈4.79, yi ≈62,所以 =0.958, =12.4,所以 = - · =12.4-0.958×12=0.904, =0.904+12 u ,即 =0.904+12ln x .(2)新药经过临床试验后,企业决定通过两条不同的生产线每天8小时批量生产该商品,其中第1条生产线的生产效率是第2条生产线的两倍.若第1条生产线出现不合格药品的概率为0.012,第2条生产线出现不合格药品的概率为0.009,两条生产线是否出现不合格药品相互独立.①随机抽取一件该企业生产的药品,求该药品不合格的概率;②若在抽查中发现不合格药品,求该药品来自第1条生产线的概率.参考公式:对于一组数据( x1, y1),( x2, y2),…,( xn ,yn ),其线性回归方程为 = + x , = , =- .解:①设 A 表示“随机抽取一件该企业生产的药品为不合格药品”,B1表示“随机抽取一件药品为第1条生产线生产”,B2表示“随机抽取一件药品为第2条生产线生产”,则 P ( B1)=, P ( B2)= ,又 P ( A | B1)=0.012, P ( A | B2)=0.009,于是 P ( A )=P [ A ∩( B1∪ B2)]= P ( AB1∪ AB2)= P ( AB1)+ P ( AB2)= P ( B1) P ( A | B1)+ P ( B2) P ( A | B2)= ×0.012+×0.009=0.011.② P ( B1|A)= == = .通性通法1. 高考常将回归模型与分布列等交汇在一起进行考查,求解时注意概率模型的应用,明确所求问题所属的事件类型是关键.2. 在两个变量的回归分析中要注意以下两点:(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算;(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.【跟踪训练】 教育部印发的《义务教育课程方案和课程标准(2022年版)》指出,自2022年秋季开始,劳动课将成为中小学一门独立课程.消息一出,“中小学生学做饭”等相关话题引发大量网友关注,儿童厨具也迅速走红.这类儿童厨具并不是指传统意义上的“过家家”,而是真锅真铲真炉灶,能让孩子煎炒烹炸,把饭菜做熟了吃下肚的“真煮”儿童厨具.一家厨具批发商从2022年5月22日起,每10天就对“真煮”儿童厨具的销量统计一次,得到相关数据如下表所示.时间 5月22~ 5月31日 6月1~ 6月10日 6月11~ 6月20日 6月21~6月30日时间 代码 x 1 2 3 4销量 y/千件 9.4 9.6 9.9 10.1时间 7月1~7月10日 7月11~7月20日 7月21~7月30日时间代码 x 5 6 7销量y/千件 10.6 11.1 11.4(1)从这7次统计数据中随机抽取2次,求这2次的销量之和超过21千件的概率;解:从7次统计数据中任意选取2次有 =21种选法,其中满足条件的有(9.9,11.4),(10.1,11.1),(10.1,11.4),(10.6,11.1),(10.6,11.4),(11.1,11.4),共6种,所以所求概率 P = = .(2)根据表中数据,判断 y 与 x 是否具有线性相关关系?若具有,试求出 y 关于 x 的线性回归方程;若不具有,请说明理由.(结果保留两位小数)附:线性回归方程为 = x + , = , =- ,相关系数 r = ,≈24.51.解:由表格数据,得 = =4,= =10.3,所以 =(-3)×(-0.9)+(-2)×(-0.7)+(-1)×(-0.4)+0×(-0.2)+1×0.3+2×0.8+3×1.1=9.7,=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,=(9.4-10.3)2+(9.6-10.3)2+(9.9-10.3)2+(10.1-10.3)2+(10.6-10.3)2+(11.1-10.3)2+(11.4-10.3)2=3.44,所以相关系数 r = = ≈0.99.因为相关系数 r ≈0.99,接近1,所以 y 与 x 具有线性相关关系,且正相关性很强.因为 = = ≈0.35,所以 = - ≈10.3-0.35×4=8.90,所以 y 关于 x 的线性回归方程为 =0.35 x +8.90.题型二 独立性检验与概率的综合【例2】 第24届冬季奥林匹克运动会在北京和张家口举行,某研究机构为了了解大学生对冰壶运动的兴趣,随机从某大学生中抽取了120人进行调查,经统计男生与女生的人数比为11∶13,男生中有30人表示对冰壶运动有兴趣,女生中有15人对冰壶运动没有兴趣.(1)根据上面数据列出2×2列联表,并判断能否有99%的把握认为“对冰壶运动是否有兴趣与性别有关”?解:根据题意列出2×2列联表如下:性别 对冰壶运动是否有兴趣 有兴趣 没有兴趣 总计男 30 25 55女 50 15 65总计 80 40 120所以χ2= ≈6.713>6.635,所以有99%的把握认为“对冰壶运动是否有兴趣与性别有关”.(2)用分层随机抽样的方法从样本中对冰壶运动有兴趣的学生中抽取8人,求抽取的男生和女生分别为多少人?若从这8人中选取两人作为冰壶运动的宣传员,求选取的2人中恰好有1位男生和1位女生的概率.附:χ2= ,其中 n = a + b + c + d .解:对冰壶运动有兴趣的学生共有80人,从中抽取8人,抽取的男生、女生分别为30× =3(人),50× =5(人).设3位男生为 a , b , c ,5位女生为 A , B , C , D , E .则从中选取2人的样本空间包含的样本点为: ab , ac , aA ,aB , aC , aD , aE , bc , bA , bB , bC , bD , bE , cA ,cB , cC , cD , cE , AB , AC , AD , AE , BC , BD , BE ,CD , CE , DE ,共28个,其中恰好有1位男生和1位女生的样本点为 aA , aB , aC , aD , aE , bA , bB , bC , bD , bE ,cA , cB , cC , cD , cE ,共15个.所以选取的2人中恰有1位男生和1位女生的概率为 P = .通性通法 概率与统计案例的结合是近几年高考的热点,解决这类问题的关键是独立性检验问题,关键是过好两关:(1)公式关:把相关数据代入独立性检验公式求χ2;(2)对比关:将求出的χ2观测值与临界值比对,作出准确判断.【跟踪训练】 新生儿的某种疾病要接种三次疫苗进行免疫,假设三次接种之间互不影响,每人每次接种成功的概率相等.为了解新生儿该疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:10 μg/次剂量组与20 μg/次剂量组,接种三次后的试验结果如下:接种方案 结果 接种成功 接种不成功 总计10 μg/次剂量组 900 100 1 00020 μg/次剂量组 973 27 1 000总计 1 873 127 2 000(1)根据数据说明哪种接种方案效果好,并依据独立性检验中χ2值,判断能否有99%的把握认为该疫苗是否接种成功与接种方案有关;解:由于两种接种方案都是1 000人接受临床试验,10 μg/次剂量组接种成功的人数为900,20 μg/次剂量组接种成功的人数为973,973>900,所以20 μg/次剂量组接种方案效果好.由χ2= ≈44.806>6.635,所以我们有99%的把握认为该疫苗是否接种成功与接种方案有关.(2)以频率代替概率,若选用接种效果好的方案,参与该试验的1000人此剂量接种三次的成功人数比只接种一次的成功人数平均提高多少?解:设20 μg/次剂量组临床试验接种一次成功的概率为 p ,由数据可知,三次接种成功的概率为 =0.973,不成功的概率为=0.027,由于三次接种之间互不影响,每人每次接种成功的概率相等,所以(1- p )3=0.027,得 p =0.7,则参与试验的1 000人此剂量只接种一次的成功人数为1 000×0.7=700,又973-700=273,所以选用20 μg/次剂量组接种方案,参与该试验的1 000人此剂量接种三次的成功人数比只接种一次的成功人数平均提高273.知能演练·扣课标02课后巩固 核心素养落地1. 对三组数据进行统计,获得以下散点图,其相关系数依次是 r1,r2, r3,则它们的大小关系是( )A. r1> r3> r2 B. r1> r2> r3C. r2> r1> r3 D. r3> r1> r212345678910111213141516解析: 由散点图可知,图①两个变量成正相关,且线性相关性较强,故 r1>0.75,图②两个变量成负相关,且线性相关性较强,故 r2<-0.75,图③两个变量线性相关性较弱,故| r3|<0.75,所以 r1> r3> r2,故选A.123456789101112131415162. 已知变量 X 和变量 Y 的线性相关系数为 r1,变量 U 和变量 V 的线性相关系数为 r2,且 r1=0.785, r2=-0.983,则( )A. X 和 Y 之间呈正线性相关关系,且 X 和 Y 的线性相关程度强于 U 和 V的线性相关程度B. X 和 Y 之间呈负线性相关关系,且 X 和 Y 的线性相关程度强于 U 和 V的线性相关程度C. U 和 V 之间呈负线性相关关系,且 X 和 Y 的线性相关程度弱于 U 和 V的线性相关程度D. U 和 V 之间呈正线性相关关系,且 X 和 Y 的线性相关程度弱于 U 和 V的线性相关程度12345678910111213141516解析: ∵ r1=0.785>0, r2=-0.983<0,∴ X 和 Y 之间呈正线性相关关系, U 和 V 之间呈负线性相关关系,又| r2|>| r1|,∴ X 和 Y 的线性相关程度弱于 U 和 V 的线性相关程度,故选C.123456789101112131415163. 某单位为了了解办公楼用电量 y (度)与气温 x (℃)之间的关系,随机统计了四个工作日用电量与当天平均气温,如下表:气温 x (℃) 18 13 10 -1用电量 y (度) 24 34 38 64由表中数据得到线性回归方程为 =-2 x + ,当气温为-4 ℃时,预测用电量为( )A. 68度 B. 67度C. 66度 D. 52度12345678910111213141516解析: 由表中数据可知: = =10, ==40,因为线性回归方程为 =-2 x + 过样本中心点,所以 =60,所以当 x =-4时, =-2 x +60=-2×(-4)+60=68,故选A.123456789101112131415164. 我国古代劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……为了验证“日落云里走,雨在半夜后”,某兴趣小组观察了所在地区100天的日落和夜晚天气,得到列联表如表所示,计算得到χ2≈19.05.下列判断不正确的是( )12345678910111213141516日落云里走 夜晚天气 下雨 未下雨出现 25 5未出现 25 45C. 有99%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D. 若出现“日落云里走”,则有99%的把握认为夜晚会下雨12345678910111213141516解析: 由频率估计概率得,夜晚下雨的概率约为 ,故A正确;当未出现“日落云里走”时,夜晚下雨的概率约为 ,故B正确;由χ2≈19.05>6.635得,有99%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C正确,D错误.故选D.123456789101112131415165. 已知 x , y 是两个具有线性相关关系的变量,其取值如下表:x 1 2 3 4 5y 4 m 9 n 11其回归直线 = x + 过点(3,7)的一个充分不必要条件是( )A. m = n =5 B. m = n =6C. m + n =11 D. m =5, n =612345678910111213141516解析: 若回归直线 = x + 过点(3,7),由题知 xi =15, =3,故(3,7)为样本中心点,所以4+ m +9+ n +11=35, m + n =11,所以 m + n =11的一个充分不必要条件可以是 m =5, n =6.故选D.123456789101112131415166. 如图是一组实验数据的散点图,拟合方程 y = + c ( x >0),令 t= ,则 y 关于 t 的回归直线过点(2,5),(12,25),则当 y ∈(1.01,1.02)时, x 的取值范围是( )A. (0.01,0.02) B. (50,100)C. (0.02,0.04) D. (100,200)12345678910111213141516解析: 根据题意可得 y = bt + c ( t >0),由 y 关于 t 的回归直线过点(2,5),(12,25)可得:所以 b =2, c =1,所以 y =2 t +1,由 y ∈(1.01,1.02)可得1.01<2 t +1<1.02,所以0.005< t <0.01,所以0.005< <0.01,所以100< x <200,故选D.123456789101112131415167. (多选)下列说法中正确的是( )B. 两个变量相关性越强,则相关系数| r |就越接近1C. 某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差 s2<212345678910111213141516解析: A选项,回归直线 = x + 恒过样本的中心点( , ),可以不过任一个样本点,A错;B选项,根据相关系数的意义,可得两个变量相关性越强,则相关系数| r |就越接近1,B对;C选项,根据平均数的计算公式可得 = =4,根据方差的计算公式 s2= [7×2+(4-4)2]=1.75<2,C对;D选项,根据回归系数的含义,可得在线性回归方程 =2-0.5 x 中,当解释变量x 增加一个单位时,预报变量 平均减少0.5个单位,D对,故选B、C、D.123456789101112131415168. (多选)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用 x (万元)与销售利润 y (万元)的统计数据,如下表,由表中数据,得回归直线 l : = x + ,则下列结论正确的是( )广告费用x/万元 3 4 6 7销售利润y/万元 6 8 10 12C. 直线 l 必过点(5,9) D. 直线 l 必过点(3,6)12345678910111213141516解析: 由表格数据得 = =5, = =9,所以直线 l 必过点(5,9),而 = = =1.4,将(5,9)代入直线方程得9=1.4×5+ ,解得 =2,故选A、B、C.123456789101112131415169. (多选)针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的 ,女生中喜欢航天的人数占女生人数的 ,若有95%的把握认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数可能为( )A. 25 B. 45C. 60 D. 7512345678910111213141516解析: 设男生的人数为5 n ( n ∈N+),根据题意列出2×2列联表如下所示:是否喜欢航天 性别 男生 女生 总计喜欢航天 4 n 3 n 7 n不喜欢航天 n 2 n 3 n总计 5 n 5 n 10 n12345678910111213141516则χ2= = ,∵有95%的把握认为是否喜欢航天与学生性别有关,∴χ2>3.841,即 >3.841,得 n >8.0661,∴5 n >40.330 5,又 n ∈N+,∴结合选项知B、C、D正确.故选B、C、D.1234567891011121314151610. 已知 x 与 y 之间的几组数据如下表所示:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得线性回归方程为 = x + .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为 y =b'x+a',则 b', a'(填“>”或“<”).< > 12345678910111213141516解析:由两组数据(1,0)和(2,2)可求得直线方程为 y =2 x -2,b'=2,a'=-2.而利用表格中的数据,可求得 = == , = - = - × =- ,所以 <b',>a'.1234567891011121314151611. 某省从2021年开始全面推行新高考制度,新高考“3+1+2”中的“1”要求考生从物理、历史中选一科,为了解学生选历史、物理与性别的关系,现随机抽取50名学生,得到结果如下表:性别 科目物理 历史男 13 10女 7 20则我们有 的把握判断选历史、物理与性别有关系.解析:根据表中数据,得到χ2= ≈4.844>3.841,所以我们有95%的把握判断选历史、物理与性别有关系.95% 1234567891011121314151612. 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为 =-20 x + .若在这些样本点中任取一点,则它在回归直线左下方的概率为 .单价 x (元) 8 8.2 8.4 8.6 8.8 9销量 y (件) 90 84 83 80 75 6812345678910111213141516解析:由表格知: = =8.5, ==80,所以-20×8.5+ =80,可得 =250,故 =-20 x +250,各单价对应预测值如下:单价 x (元) 8 8.2 8.4 8.6 8.8 9销量 y (件) 90 86 82 78 74 70所以在回归直线左下方的样本点有(8.2,84),(9,68)两个,故概率为 .1234567891011121314151613. 某企业年研发费用 x (百万元)与企业年利润 y (百万元)之间具有线性相关关系,该企业近5年的年研发费用和年利润的具体数据如下表:年研发费用 x (百万元) 1 2 3 4 5年利润 y (百万元) 2 3 4 4 712345678910111213141516(1)求 y 关于 x 的线性回归方程;解:依题意, = =3,又 =4, xiyi =71, =55,则 = = =1.1, = - =4-1.1×3=0.7,所以 y 关于 x 的线性回归方程为 =1.1 x +0.7.12345678910111213141516(2)如果该企业某年研发费用投入8百万元,预测该企业获得的年利润为多少?参考公式:线性回归方程 = x + 的斜率和截距的最小二乘法公式分别为:= , = - .参考数据: =4, xiyi =71, =55.12345678910111213141516解:由(1)知,当 x =8时, =1.1×8+0.7=9.5,所以当该企业某年研发费用投入8百万元时,预测该企业获得的年利润为9.5百万元.1234567891011121314151614. 2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表:12345678910111213141516性别 天文爱好情况 天文爱好者 非天文爱好者 总计女 20 50男 15总计 100附:χ2= ,其中 n = a + b + c + d .12345678910111213141516(1)将上表中的数据填写完整,并判断能否有99%的把握认为“天文爱好者”或“非天文爱好者”与性别有关?解:性别 天文爱好情况 天文爱好者 非天文爱好者 总计女 20 30 50男 35 15 50总计 55 45 10012345678910111213141516χ2== ≈9.091>6.635,故能有99%的把握认为“天文爱好者”或“非天文爱好者”与性别有关.12345678910111213141516(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层随机抽样抽取5人,然后再从这5人中随机选出3人,求其中至少有1人是“天文爱好者”的概率.12345678910111213141516解:因为抽取的女性人群中,“天文爱好者”和“非天文爱好者”这两种类型人数比为20∶30=2∶3,故按分层随机抽样抽取的5人中:2名为“天文爱好者”,编号为 a 、 b ;3名为“非天文爱好者”,编号为1、2、3,则从这5人中随机选出3人,所有可能结果如下:ab 1, ab 2, ab 3, a 12, a 13, a 23, b 12, b 13, b 23,123,共10种情况,其中至少有1人是“天文爱好者”的有9种,所以概率为 .1234567891011121314151615. 学校为了进一步加快推进学生素质教育,丰富学生的课余生活,挖掘学生的动手动脑潜力,在高一年级进行了一次“变废为宝”手工作品评比,对参赛作品进行统计得到如下统计表:性别 作品是否合格 不合格 合格 总计男生 120 100 220女生 30 50 80总计 150 150 30012345678910111213141516(1)运用独立性检验的思想方法判断:能否有99%以上的把握认为性别与作品是否合格有关联?并说明理由;解:由题意可得χ2= ≈6.818>6.635,所以有99%的把握认为性别与作品是否合格有关.12345678910111213141516(2)学校为了鼓励更多的同学参与到“变废为宝”活动中来,决定通过3轮挑战赛评选出一些“手工达人”,3轮挑战结束后,至少2次挑战成功的参赛者被评为本学期的“手工达人”.已知某参赛者挑战第一、二、三轮成功的概率分别为 , , ,求该参赛者在本学期3轮挑战中成功的次数 X 的分布列及数学期望 EX .参考公式:χ2= , n = a + b + c +d .12345678910111213141516解:X 的所有可能值分别为0,1,2,3.P ( X =0)= × × = ,P ( X =1)= × × + × × + × × = ,P ( X =2)= × × + × × + × × = ,P ( X =3)= × × = .故 X 的分布列为X 0 1 2 3PEX =0× +1× +2× +3× = .1234567891011121314151616. 当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:关卡 x 1 2 3 4 5 6平均过关时间 y (单位:秒) 50 78 124 121 137 35212345678910111213141516计算得到一些统计量的值为: ui =28.5, xiui =106.05,其中, ui =ln yi .参考公式:对于一组数据( xi , yi )( i =1,2,3,…, n ),其线性回归方程为 = x + , = , = - .12345678910111213141516(1)若用模型 y = a e bx 拟合 y 与 x 的关系,根据提供的数据,求出y 与 x 的回归方程;解:y = a e bx 两边取对数可得ln y =ln ( a e bx )=ln a +ln e bx ,即ln y =ln a + bx ,令 ui =ln yi ,所以 u = bx +ln a ,由 = ui =4.75,= (1+2+3+4+5+6)=3.5, =12+22+32+42+52+62=91.12345678910111213141516所以 = = =0.36,又 = +ln a ,即4.75=0.36×3.5+ln a ,所以ln a =3.49,所以 a =e3.49.所以 y 关于 x 的回归方程为 y =e0.36 x+3.49.12345678910111213141516(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获得-1分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为 ,若甲玩一轮此款益脑游戏,求“甲获得的积分 X ”的分布列和数学期望.12345678910111213141516解:由题知,甲获得的积分 X 的所有可能取值为5,7,9,12,所以 P ( X =5)= , P ( X =7)= × = ,P ( X =9)= × = , P ( X =12)= = ,所以 X 的分布列为X 5 7 9 12P所以 EX =5× +7× +9× +12× = .12345678910111213141516谢 谢 观 看! 展开更多...... 收起↑ 资源列表 3 培优课 统计案例与概率.docx 3 培优课 统计案例与概率.pptx 3 培优课 统计案例与概率(练习,含解析).docx