资源简介 专题五 统计与概率第一讲 统计与统计案例、概率——小题备考微专题1 统计问题常考常用结论1.直方图的两个结论(1)小长方形的面积=组距×=频率.(2)各小长方形的面积之和等于1.2.统计中的四个数字特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即=(x1+x2+…+xn).(4)方差与标准差方差:s2=[(x1-)2+(x2-)2+…+(xn-)2].标准差:s=.保分题1.[2022·福建莆田三模]已知某校有教职工560人,其中女职工240人,现按性别用分层抽样的方法从该校教职工中抽取28人,则抽取的男职工人数与抽取的女职工人数之差是( )A.2 B.4C.6 D.82.[2022·山东济南一模]某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐四种树苗共计1200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别为600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏的数量为( )A.34B.46C.50D.703.[2022·福建南平三模](多选)支气管炎患者会咳嗽失眠,给患者日常生活带来严重的影响.某医院老年患者治愈率为20%,中年患者治愈率为30%,青年患者治愈率为40%.该医院共有600名老年患者,500名中年患者,400名青年患者,则( )A.若从该医院所有患者中抽取容量为30的样本,老年患者应抽取12人B.该医院青年患者所占的频率为C.该医院的平均治愈率为28.7%D.该医院的平均治愈率为31.3%提分题例1(1)[2022·辽宁沈阳二模](多选)甲、乙两人进行飞镖游戏,甲的10次成绩分别为8,6,7,7,8,10,10,9,7,8,乙的10次成绩的平均数为8,方差为0.4,则( )A.甲的10次成绩的极差为4B.甲的10次成绩的75%分位数为8C.甲和乙的20次成绩的平均数为8D.甲和乙的20次成绩的方差为1(2)[2022·山东德州二模](多选)教育部办公厅“关于进一步加强中小学生体质健康管理工作的通知”中指出,各地要加强对学生体质健康重要性的宣传,中小学校要通过体育与健康课程、大课间、课外体育锻炼、体育竞赛、班团队活动,家校协同联动等多种形式加强教育引导,让家长和中小学生科学认识体质健康的影响因素.了解运动在增强体质、促进健康、预防肥胖与近视、锤炼意志、健全人格等方面的重要作用,提高学生体育与健康素养,增强体质健康管理的意识和能力,某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则( )A.样本的众数为67B.样本的80%分位数为72C.样本的平均值为66D.该校男生中低于60公斤的学生大约为300人听课笔记:技法领悟众数、中位数、平均数与直方图的关系1.众数为频率分布直方图中最高矩形的底边中点的横坐标.2.中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.3.平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之积的和.巩固训练11.[2022·山东济宁二模](多选)已知一组数据x1,x2,…,x11是公差不为0的等差数列,若去掉数据x6,则( )A.中位数不变B.平均数变小C.方差变大D.方差变小2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差微专题2 统计案例问题 常考常用结论1.方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中是待定参数,回归方程的斜率和截距分别为==,()是样本中心点,回归直线过样本中心点.2.(1)正相关与负相关就看回归直线的斜率,斜率为正则为正相关,斜率为负则为负相关.(2)样本相关系数r具有以下性质:r>0表示两个变量正相关,r<0表示两个变量负相关;|r|≤1,且|r|越接近于1,线性相关程度越强,|r|越接近于0,线性相关程度越弱.3.“卡方公式”:χ2=,n=a+b+c+d.保分题1.[2022·山东临沂二模](多选)对两组数据进行统计后得到的散点图如图,关于其线性相关系数的结论正确的是( )A.r1<0B.r2>1C.r1+r2>0D.|r1|>|r2|2.[2022·山东聊城一模]根据分类变量x与y的成对样本数据,计算得到χ2=6.147.依据α=0.01的独立性检验(x0.01=6.635),结论为( )A.变量x与y不独立B.变量x与y不独立,这个结论犯错误的概率不超过0.01C.变量x与y独立D.变量x与y独立,这个结论犯错误的概率不超过0.013.[2022·河北邯郸一模]已知具有线性相关的变量x,y,设其样本点为Ai(xi,yi)(i=1,2,3,…,8),回归直线方程为=-2x+,若=12,=16,则=( )A.5B.3C.1D.-1提分题例2(1)[2022·湖北黄冈中学二模](多选)已知由样本数据(xi,yi)(i=1,2,3,…,10)组成的一个样本,得到回归直线方程为=2x-0.4,且=2,去除两个样本点(-2,1)和(2,-1)后,得到新的回归直线的斜率为3.则下列说法正确的是( )A.相关变量x,y具有正相关关系B.去除两个样本点(-2,1)和(2,-1)后,回归直线方程为=3x-3C.去除两个样本点(-2,1)和(2,-1)后,随x值增加相关变量y值增加速度变小D.去除两个样本点(-2,1)和(2,-1)后,样本(4,8.9)的残差为0.1(2)[2022·福建厦门模拟](多选)某市为了研究该市空气中的PM2.5浓度和SO2浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SO2浓度(单位:μg/m3),得到如图所示的2×2列联表:[0,150] (150,475][0,75] 64 16(75,115] 10 10经计算χ2=≈7.4844,则可以推断出( )附:χ2=α 0.050 0.010 0.001xα 3.841 6.635 10.828A.该市一天空气中PM2.5浓度不超过,且SO2浓度不超过150μg/m3的概率估计值是0.64B.若2×2列联表中的天数都扩大到原来的10倍,χ2的观测值不会发生变化C.有超过99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与SO2浓度有关听课笔记:技法领悟1.求回归直线方程的关键(1)正确理解的计算公式并能准确地进行运算.(2)根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过回归直线方程估计和预测变量的值.2.独立性检验的关键(1)根据2×2列联表准确计算χ2,若2×2列联表没有列出来,要先列出此表.(2)χ2的观测值越大,对应假设事件H0成立的概率越小,H0不成立的概率越大.巩固训练21.[2022·辽宁大连二模]色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得如下数据:色差x 21 23 25 27 29 31色度y 15 16 19 20 21 23已知该产品的色度y和色差x之间满足线性相关关系,且=0.8x+,现有一对测量数据为(33,25.2),则该数据的残差为( )A.0.6B.0.4C.-0.4D.-0.62.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.附:χ2=.α 0.05 0.025 0.010 0.001xα 3.841 5.024 6.635 10.828微专题3 概率问题常考常用结论1.古典概型的概率公式P(A)=2.条件概率P(B|A)==3.全概率:P(B)=相互独立事件的概率:P(AB)=P(A)P(B)5.二项分布:Pn(k)=pk(1-p)n-k;E(X)=np;D(X)=np(1-p)6.超几何分布:P(X=k)=,k=m,m+1,m+2,…,r.其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.E(X)=np=7.正态分布:若X~N(μ,σ2),则如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.保分题1.[2022·新高考Ⅰ卷]从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )A.B.C.D.2.[2022·山东济南二模](多选)袋中装有除颜色外完全相同的1个红球和2个白球,从袋中不放回的依次抽取2个球.记事件A=“第一次抽到的是白球”,事件B=“第二次抽到的是白球”,则( )A.事件A与事件B互斥B.事件A与事件B相互独立C.P(B)=D.P(A|B)=3.[2022·广东惠州二模]在一次教学质量调研测试中,某学校高三有1200名学生,全部学生的数学成绩X服从正态分布N(μ,σ2),若P(X≥100)=0.5,且P(X≥120)=0.2,则本次测试数学成绩在80到120之间的学生约有________人.提分题例3(1)[2022·广东汕头一模]有4名大学生志愿者参加2022年北京冬奥会志愿服务.冬奥会志愿者指挥部随机派这4名志愿者参加冰壶、短道速滑、花样滑冰3个项目比赛的志愿服务,则每个项目至少安排一名志愿者进行志愿服务的概率为( )A.B.C.D.(2)[2022·全国乙卷]某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为p1,p2,p3,且p3>p2>p1>0.记该棋手连胜两盘的概率为p,则( )A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大听课笔记:技法领悟求复杂事件概率的两种方法1.直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或一独立重复试验问题,然后用相应概率公式求解.2.间接法:当复杂事件正面情况比较多,反面情况较少,则可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.巩固训练31.[2022·湖南益阳一模]甲、乙、丙、丁4名棋手进行象棋比赛,赛程如下面的框图所示,其中编号为i的方框表示第i场比赛,方框中是进行该场比赛的两名棋手,第i场比赛的胜者称为“胜者i”,负者称为“负者i”,第6场为决赛,获胜的人是冠军.已知甲每场比赛获胜的概率均为,而乙、丙、丁之间相互比赛,每人胜负的可能性相同.则甲获得冠军的概率为( )A.B.C.D.2.[2022·山东济宁一模]甲、乙两个箱子里各装有5个大小形状都相同的球,其中甲箱中有3个红球和2个白球,乙箱中有2个红球和3个白球.先从甲箱中随机取出一球放入乙箱中,再从乙箱中随机取出一球,则取出的球是红球的概率为( )A.B.C.D.专题五 统计与概率第一讲 统计与统计案例、概率微专题1 统计问题保分题1.解析:抽取的女职工人数为:×28=12人,抽取的男职工人数为:28-12=16人,则抽取的男职工人数与抽取的女职工人数之差为:16-12=4人.答案:B2.解析:由扇形统计图知,购买的1 200棵树苗中,侧柏的数量为1 200×25%=300,依题意,高一、高二、高三分到的侧柏的棵数比为:600∶400∶200=3∶2∶1,所以高三年级应分得侧柏的数量为×300=50.答案:C3.解析:对于A,由分层抽样可得,老年患者应抽取30×=12人,正确;对于B,青年患者所占的频率为=,正确;对于C,平均治愈率为≈28.7%,正确;对于D,由C知错误.答案:ABC提分题[例1] 解析:(1)甲的10次成绩中,最大值为10,最小值为6,极差等于4,故A正确,因为10×75%=7.5,所以将甲的10次成绩从小到大排列后,第8个数为75%分位数,即75%分位数等于9,故B不正确,经计算,甲的10次成绩的平均数等于8,又已知乙的10次成绩的平均数等于8,则甲和乙的20次成绩的平均数为8,故C正确,=[(6-8)2+3×(7-8)2+(9-8)2+2×(10-8)2]=1.6,s2==×[(10×1.6+10×0.4)+×0]=1,故D正确,方差也可以用s2==)=进行求解,即:======0.4,所以=1,故D正确.(2)对于A,样本的众数为=67,故A正确;对于B,由频率分布直方图可知样本的80%分位数为70+×5=72.5 ,故B正确;对于C,由直方图估计样本平均值为:57.5×0.15+62.5×0.25+67.5×0.3+72.5×0.2+77.5×0.1=66.75,故C错误;对于D,2 000名男生中体重低于60 kg的人数大约为2 000×5×0.03=300,故D正确.答案:(1)ACD (2)ABD[巩固训练1]1.解析:对于选项A,原数据的中位数为x6,去掉x6后的中位数为(x5+x7)=x6,即中位数没变,故选项A正确;对于选项B,原数据的平均数为=(x1+x2+…+x11)==x6,去掉x6后的平均数为′=(x1+x2+…+x5+x7+x8+…+x11)==x6=即平均数不变,故选项B错误;对于选项C,则原数据的方差为s2=[(x1-x6)2+(x2-x6)2+…+(x11-x6)2],去掉x6后的方差为s′2=[(x1-x6)2+(x2-x6)2+…+(x5-x6)2+(x7-x6)2+…+(x11-x6)2],故s2答案:AC2.解析:甲的平均数是=6,中位数是6,极差是4,方差是=2;乙的平均数是=6,中位数是5,极差是4,方差是=,比较可得选项C正确.答案:C微专题2 统计案例问题保分题1.解析:由散点图可知,线性相关系数r1的图象表示y与x成负相关,故-1r2>0,故B错误;∵线性相关系数r2的点较线性相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误.答案:AC2.解析:按照独立性检验的知识及比对的参数值,当χ2=6.147,我们可以下结论变量x与y独立.故排除选项A,B;依据α=0.01的独立性检验(x0.01=6.635),6.147<6.635,所以我们不能得到“变量x与y独立,这个结论犯错误的概率不超过0.01”这个结论.故C正确,D错误.答案:C3.解析:因为=12,所以=,因为=16,所以=2.因为线性回归直线经过样本中心点,所以2=-2×,解得=5.答案:A提分题[例2] 解析:(1)对于A,去除两个样本点(-2,1)和(2,-1)后,得到新的回归直线的斜率为3,3>0,则相关变量x,y具有正相关关系,故A正确;对于B,由=2代入y=2x-4得=3.6,则去除两个样本点(-2,1)和(2,-1)后,得到新的=====-3×=-3,故去除样本点后的回归直线方程为=3x-3,故B正确;对于C,由于斜率为3>2,故相关变量x,y具有正相关关系且去除样本点后,随x值增加相关变量y值增加速度变大,故C错误;对于D,当x=4时,y=3×4-3=9,则样本(4,8.9)的残差为8.9-9=-0.1,故D错误.(2)补充完整列联表如下:SO2 PM2.5 [0,150] (150,475] 合计[0,75] 64 16 80(75,115] 10 10 20合计 74 26 100对于A选项,该市一天中,空气中PM2.5浓度不超过75 μg/m3,且SO2浓度不超过150 μg/m3的概率估计值为=0.64,故A正确;对于B选项,χ2==≈74.844≠7.484 4,故B不正确;因为7.484 4>6.635,根据临界值表可知,在犯错的概率不超过1%的条件下,即有超过99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关,故C,D均正确.答案:(1)AB (2)ACD[巩固训练2]1.解析:由表中数据可得=(21+23+25+27+29+31)=26,=(15+16+19+20+21+23)=19,将(26,19)代入回归直线方程得到=-1.8,∴=0.8x-1.8.将x=33代入,可得=0.8×33-1.8=24.6,因此其残差为25.2-24.6=0.6.答案:A2.解析:2×2列联表如下:通过 未通过 总计集中培训 45 10 55分散培训 30 20 50总计 75 30 105∴χ2==6.109>5.024,∴认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.025.答案:0.025微专题3 概率问题保分题1.解析:方法一 从2,3,4,5,6,7,8中随机取2个不同的数有=21(种)结果,其中这2个数互质的结果有(2,3),(2,5),(2,7),(3,4),(3,5),(3,7),(3,8),(4,5),(4,7),(5,6),(5,7),(5,8),(6,7),(7,8),共14种,所以所求概率为=.故选D.方法二 从2,3,4,5,6,7,8中随机取2个不同的数有=21(种)结果,其中这2个数不互质的结果有(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,所以所求概率为=.故选D.答案:D2.解析:对于A,由于第一次抽到的是白球和第二次抽到白球,可以同时发生,故事件A与事件B不互斥,A错误;对于B,由于是从袋中不放回的依次抽取2个球,因此第一次抽球的结果对第二次抽到什么颜色的球是有影响的,因此事件A与事件B不是相互独立关系,B错误;对于C,事件B=“第二次抽到的是白球”,分两种情况,即第一次抽到红球第二次抽到白球和第一次抽到白球第二次也抽到白球,故P(B)==,故C正确;对于D,P(AB)==,故P(A|B)===,故D正确.答案:CD3.解析:由题意P(80≤X≤100)=P(100≤X≤120)=p(X≥100)-P(X≥120)=0.5-0.2=0.3,所以P(80≤X≤120)=0.3+0.3=0.6.人数为1200×0.6=720.答案:720提分题[例3] 解析:(1)先将4人分成3组,其一组有2人,另外两组各1人,共有=6种分法,然后将3个项目全排列,共有=6种排法,所以每个项目至少安排一名志愿者进行志愿服务的方法数为6×6=36种,因为4名志愿者参加3个项目比赛的志愿服务的总方法数为34=81种,所以每个项目至少安排一名志愿者进行志愿服务的概率为=.(2)设第二盘与甲比赛,则p甲=p2p1(1-p3)+(1-p2)p1p3=p1(p2+p3-2p2p3).设第二盘与乙比赛,则p乙=p2p1(1-p3)+(1-p1)p2p3=p2(p1+p3-2p1p3).设第二盘与丙比赛,则p丙=p3p1(1-p2)+(1-p1)p2p3=p3(p1+p2-2p1p2).p甲-p乙=p3(p1-p2)<0,p甲-p丙=p2(p1-p3)<0,p乙-p丙=p1(p2-p3)<0,故p丙>p乙>p甲.选D.答案:(1)D (2)D[巩固训练3]1.解析:甲获得冠军,则甲参加的比赛结果有三种情况:1胜3胜6胜; 1胜3负5胜6胜; 1负4胜5胜6胜;所以甲获得冠军的概率为()3+2×()3×=.答案:D2.解析:设事件A表示从甲箱中随机取出一红球放入乙箱中,事件B表示从甲箱中随机取出一白球放入乙箱中,设事件C表示:从甲箱中随机取出一球放入乙箱中,再从乙箱中随机取出一球,则取出的球是红球,则有:P(A)=,P(C|A)==,P(B)=,P(C|B)==,所以P(C)=P(A)P(C|A)+P(B)P(C|B)==.答案:B 展开更多...... 收起↑ 资源预览