资源简介 (共63张PPT)第二节用样本估计总体明确目标1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.目录01.课前·“四基”落实02.课堂·题点精研03.课时跟踪检测课前·“四基”落实01教材再回首1.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有____的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)四分位数:第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.p%2.众数、中位数、平均数(1)众数:一组数据中_________________的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于_______位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把______________称为a1,a2,…,an这n个数的平均数.出现次数最多最中间3.标准差与方差设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是s=,s2=[(x1-)2+(x2-)2+…+(xn-)2].4.比例分配的分层随机抽样所获得样本的均值与方差利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为n1,均值为,方差为;第二层的样本量为n2,均值为,方差为,则总的样本均值=__________________,总的样本方差s2=_______________________________.+[+(-)2]+[+(-)2]典题细发掘1.(人A必修②P181T1)为了合理调配电力资源,某市欲了解全市50 000户居民的日用电量.若通过简单随机抽样从中抽取了300户进行调查,得到其日用电量的平均数为5.5 kW·h,则可以推测全市居民用户日用电量的平均数 ( )A.一定为5.5 kW·h B.高于5.5 kW·hC.低于5.5 kW·h D.约为5.5 kW·h解析:由样本的数字特征与总体的数字特征的关系,可知全市居民用户日用电量的平均数约为5.5 kW·h.√2.(人A必修②P216T3改编)[多选]在去年的足球联赛上,甲队每场比赛平均失球数是1.5,方差为1.1;乙队每场比赛平均失球数是2.1,方差是0.4,下列说法正确的有 ( )A.平均来说甲队比乙队防守技术好B.乙队比甲队的防守技术更稳定C.每轮比赛甲队的失球数一定比乙队少D.乙队可能有一半的场次不失球√√3.(人B必修②P70T2改编)计算数据1,2,3,4,5,6,7,8,9,10的40%分位数为____. 解析:将数据从小到大排列后可得1,2,3,4,5,6,7,8,9,10,因为10×40%=4,所以这组数据的40%分位数是=4.5.4.(苏教必修②P271T10改编)已知数据x1,x2,…,x10的平均数为2,方差为3,那么数据2x1+3,2x2+3,…,2x10+3的平均数和方差分别为_________. 4.57,12课堂·题点精研02[例1] (1)(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理下表:根据表中数据,下列结论中正确的是 ( )题点一 样本数字特征的估计亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150,1 200]频数 6 12 18 30 24 10A.100块稻田亩产量的中位数小于1 050 kgB.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200 kg至300 kg之间D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间√解析:根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg,故A错误;亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为=66%,故B错误;稻田亩产量的极差最大约为1 200-900=300,最小约为1 150-950=200,故C正确;由频数分布表可得,100块稻田亩产量的平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.(2)(2023·新课标Ⅰ卷)[多选]有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则 ( )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差√√解析:取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为,故A、C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x1,x2,…,x6的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x2,x3,x4,x5的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.故选BD.(1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a.(2)数据x1,x2,…,xn与数据x1'=x1+a,x2'=x2+a,…,xn'=xn+a的方差相等,即数据经过平移后方差不变.(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.谨记结论计算一组数据的第p百分位数的步骤思维建模1.(2025·广州模拟)[多选]已知样本数据7,3,5,3,10,8,则这组数据的 ( )A.众数为3 B.平均数为6.5C.上四分位数为8 D.方差为即时训练√√√解析:首先,我们把数据从小到大排列,得到3,3,5,7,8,10,观察得数据3出现的次数最多,所以众数为3,故A正确;平均数为==6,故B错误;因为一共有6个数据,且6×75%=4.5,所以上四分位数为第5个数,故上四分位数为8,故C正确;方差为[(3-6)2+(3-6)2+(5-6)2+(7-6)2+(8-6)2+(10-6)2]=(9+9+1+1+4+16)=×40=,故D正确.2.学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4 000名学生(男、女生人数之比为3∶2)中抽取了一个容量为100的样本.其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179,用样本估计总体,则该学校学生身高的方差为_____.解析:根据题意,由于男、女生人数之比为3∶2,则样本中男女生人数之比为3∶2,其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179,则样本的平均数=×175+×160=169,样本的方差s2=×[184+(175-169)2]+×[179+(160-169)2]=236,用样本估计总体,则该学校学生身高的方差为236.236[例2] 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下频率分布直方图.题点二 频率分布直方图中的数字特征记C为事件“乙离子残留在体内的百分比不高于5.5”,根据直方图得到P(C)的估计值为0.30.(1)求乙离子残留百分比直方图中a,b的值;解:由已知得0.30=0.05+b+0.15,解得b=0.10,所以a=1-0.20-0.15-0.30=0.35.(2)求甲离子残留百分比的第75百分位数;解:根据频率分布直方图,易知甲离子残留百分比的第75百分位数在区间[4.5,5.5),设为x,则0.15+0.20+0.30+(x-4.5)×0.20=0.75,解得x=5.0,所以甲离子残留百分比的第75百分位数为5.0.(3)估计乙离子残留百分比的平均数.(同一组数据用该组区间的中点值为代表)解:乙离子残留百分比的平均数的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.0.用频率分布直方图估计样本的数字特征(1)平均数:= (xi表示第i个小矩形底边中点的横坐标,Si表示第i个小矩形的面积).(2)方差:s2=(3)众数:最高小矩形底边中点的横坐标.(4)中位数:把频率分布直方图划分为左、右两个面积相等的部分时,分界线与横轴交点的横坐标.思维建模(5)百分位数:类比中位数,百分位数所在垂直于x轴的直线把频率分布直方图划分为左、右两个部分,左边所有矩形的面积和为p%.中位数是第50百分位数.求解公式:已知频率分布直方图的组距为d.①找出百分位数所在的矩形区间[a,b);②第p百分位数=a+d·.3.随着时代不断地进步,人们的生活条件也越来越好,越来越多的人注重自己的身材,其中体脂率是一个很重要的衡量标准.根据一般的成人标准,女性体脂率的正常范围是20%至25%,男性的正常范围是15%至18%.这一范围适用于大多数成年人,可以帮助判断个体是否存在肥胖的风险.某市有关部门对全市100万名成年女性的体脂率进行一次抽样调查统计,抽取了1 000名成年女性的体脂率作为样本绘制频率分布直方图如图.即时训练(1)求a;解:由频率分布直方图可得5×2a+5×0.03+5×0.07+5×6a+5×2a=1,所以a=0.01.(2)如果女性体脂率为25%至30%属“偏胖”,体脂率超过30%属“过胖”,那么全市女性“偏胖”,“过胖”各约有多少人 解:由频率分布直方图可得样本中女性“偏胖”的频率为5×0.06=0.3,样本中女性“过胖”的频率为5×0.02=0.1,所以全市女性“偏胖”的人数约为1 000 000×0.3=300 000,全市女性“过胖”的人数约为1 000 000×0.1=100 000.(3)小王说:“我的体脂率是调查所得数据的中位数.”小张说:“我的体脂率是调查所得数据的平均数.”那么谁的体脂率更低 解:调查所得数据的平均数为12.5×0.1+17.5×0.15+22.5×0.35+27.5×0.3+32.5×0.1=23.25,即小张的体脂率为23.25%.设调查所得数据的中位数为x,因为0.1+0.15=0.25<0.5,0.1+0.15+0.35=0.6>0.5,所以20所以0.25+(x-20)×0.07=0.5,所以x=≈23.57,即小王的体脂率为23.57%.所以小张的体脂率更低.[例3] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:题点三 总体离散程度的估计试验序号i 1 2 3 4 5 6 7 8 9 10伸缩率xi 545 533 551 522 575 544 541 568 596 548伸缩率yi 536 527 543 530 560 533 522 550 576 536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.(1)求,s2.解:由题意,求出zi的值如表所示,则=×(9+6+8-8+15+11+19+18+20+12)=11,s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.试验序号i 1 2 3 4 5 6 7 8 9 10zi 9 6 8 -8 15 11 19 18 20 12(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高().解:因为2=2==11=>,所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.思维建模4.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图.即时训练(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;解:甲厂10个轮胎宽度的平均数=×(195+194+196+193+194+197+196+195+193+197)=195(mm),乙厂10个轮胎宽度的平均数=×(195+196+193+192+195+194+195+192+195+193)=194(mm).(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个的轮胎相对更好 解:甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195,平均数=×(195+194+196+194+196+195)=195,方差=×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=,乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195,平均数=×(195+196+195+194+195+195)=195,方差=×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=.∵两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,∴乙厂的轮胎相对更好.课时跟踪检测03一、单选题1.已知一组数据1,2,3,4,x的下四分位数是x,则x的可能取值为( )A.5 B.4C.3 D.2解析:一共有5个数据,5×25%=1.25,故数据的下四分位数为数据从小排到大的第2个数据,所以1≤x≤2.√15678910112342.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则 ( )A.a>b>c B.b>c>aC.c>a>b D.c>b>a解析:数据从小到大排列得10,12,14,14,15,15,16,17,17,17.则有a=×(15+17+14+10+15+17+17+16+14+12)=14.7,b=×(15+15)=15,c=17.所以c>b>a.故选D.√15678910112343.(2025·贵阳模拟)为了了解某班学生数学成绩,利用分层随机抽样抽取了一个10人的样本,统计如下:则可估计全班学生数学的平均分和方差分别为 ( )1567891011234 学生数 平均分 方差男生 6 80 7女生 4 75 2A.77.5,5 B.77.5,11C.78,5 D.78,11解析:可估计全班学生数学的平均分为80×+75×=78,方差为[7+(80-78)2]+[2+(75-78)2]=11.故选D.1567891011234√4.某老师对比甲、乙两名学生最近5次数学月考成绩,甲:126,137,118,129,140,乙:115,125,117,119,124,则下列结论正确的是 ( )A.甲成绩的平均数较小B.乙成绩的中位数较大C.乙成绩的极差较大D.乙比甲的成绩稳定√1567891011234解析:设甲、乙成绩的平均数分别为,方差分别为,则=×(126+137+118+129+140)=130,=×(115+125+117+119+124)=120,∴>,甲成绩的平均数较大,故A错误;甲成绩的中位数为129,乙成绩的中位数为119,乙成绩的中位数较小,故B错误;1567891011234甲成绩的极差为140-118=22,乙成绩的极差为125-115=10,乙成绩的极差较小,故C错误;=×[(-4)2+72+(-12)2+(-1)2+102]=62,=×[(-5)2+52+(-3)2(-1)2+42]=15.2,∴>,乙比甲的成绩稳定,故D正确.15678910112345.在践行“乡村振兴”战略的过程中,某地大力发展特色花卉种植业.某农户种植一种观赏花卉,为了解花卉的长势,随机测量了100枝花卉的高度(单位:cm),得到花卉高度的频率分布直方图,如图所示,则下列说法正确的是 ( )A.样本花卉高度的极差不超过20 cmB.样本花卉高度的中位数不小于众数C.样本花卉高度的平均数不小于中位数D.样本花卉高度小于60 cm的占比不超过70%√1567891011234解析:对于A,由频率分布直方图可知,样本花卉高度的极差为70-40=30(cm),A错误;对于B,样本花卉高度的众数为=57.5(cm),设样本花卉高度的中位数为a cm,前三个矩形的面积和为(0.012+0.028+0.036)×5=0.38,前四个矩形的面积和为0.38+0.056×5=0.66,故a∈(55,60),由中位数的定义可得0.38+(a-55)×0.056=0.5,解得a≈57.14(cm),则a<57.5,所以样本花卉高度的中位数小于众数,B错误;1567891011234对于C,由频率分布直方图可知,样本花卉高度的平均数为=42.5×0.06+47.5×0.14+52.5×0.18+57.5×0.28+62.5×0.24+67.5×0.1=56.5(cm),则15678910112346.某同学掷一枚正方体骰子5次,记录每次骰子出现的点数,统计出结果的平均数为2,方差为0.4,可判断这组数据的众数为 ( )A.1 B.2C.3 D.4√1567891011234解析:不妨设五个点数为x1≤x2≤x3≤x4≤x5,由题意知平均数为2,方差为0.4,则(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2=2,x1+x2+x3+x4+x5=10.可知五次的点数中最大点数不可能为4,5,6.五个点也不可能都是2,则五个点数情况可能是3,3,2,1,1,其方差为×[(3-2)2+(3-2)2+(2-2)2+(1-2)2+(1-2)2]==0.8,不合题意.若五个点数情况为3,2,2,2,1,其方差为×[(3-2)2+(2-2)2+(2-2)2+(2-2)2+(1-2)2]==0.4,符合题意,其众数为2.1567891011234二、多选题7.(2025·大庆一模)为弘扬奥运精神,某学校组织高一年级学生进行奥运专题的答题活动.为了调查男生和女生对奥运会的关注程度,在高一年级随机抽取10名男生和10名女生的竞赛成绩(满分100分),按从低到高的顺序排列,得到下表中的样本数据:则下列说法正确的是 ( )1567891011234男生 82 85 86 87 88 90 90 92 94 96女生 82 84 85 87 87 87 88 88 90 92A.男生样本数据的25%分位数是86B.男生样本数据的中位数小于男生样本数据的众数C.女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变D.女生样本数据中去掉一个最高分和一个最低分后所得数据的方差不变1567891011234√√√解析:10×25%=2.5,所以男生样本数据的25%分位数是86,故A正确;男生样本数据的中位数为=89,男生样本数据的众数为90,故B正确;女生样本数据的平均数为×(82+84+85+87×3+88×2+90+92)=87,女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数为×(84+85+87×3+88×2+90)=87,故C正确;女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变,但是极差变小,所以方差变小,故D错误.1567891011234三、填空题8.(2025·贵阳开学考试)已知一组样本数据1,2,m,6的极差为6,若m>0,则m=_____,这组数据的方差为____. 解析:因为一组样本数据1,2,m,6的极差为6,且m>0,所以m-1=6,解得m=7,则==4,所以方差为s2=[(1-4)2+(2-4)2+(6-4)2+(7-4)2]=(9+4+4+9)=.1567891011234 79.互不相等的4个正整数从小到大排序为a1,a2,a3,a4,若它们的平均数为4,且这4个数据的极差是中位数的2倍,则这4个数据的中位数为_____. 解析:由题意可知,a1+a2+a3+a4=16,a4-a1=2×=a2+a3,所以a4=a1+a2+a3=16-a4,解得a4=8,所以a1+a2+a3=8.又因为a1,a2,a3,a4是互不相等的4个正整数从小到大排序的,所以a1=1,a2=2,a3=5或a1=1,a2=3,a3=4,所以这4个数据的中位数为=.1567891011234四、解答题10.(10分)(2025·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:1567891011234甲 82 81 79 78 95 88 93 84乙 92 95 80 75 83 80 90 851567891011234(1)求两名学生预赛成绩的平均数和方差;(5分)解:=×(82+81+79+78+95+88+93+84)=85,=×(92+95+80+75+83+80+90+85)=85,=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.1567891011234(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪名学生参加合适 请说明理由.(5分)解:由(1)知=<,甲的成绩较稳定,所以派甲参赛比较合适.11.(13分)(2025·孝感模拟)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频率分布直方图.1567891011234(1)求频率分布直方图中a的值;(3分)解:每组小矩形的面积之和为1,∴(0.005+0.010+0.020+a+0.025+0.010)×10=1,∴a=0.030.1567891011234(2)求样本成绩的第75百分位数;(3分)解:成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=0.65,落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,设第75百分位数为m,由0.65+(m-80)×0.025=0.75,得m=84,故第75百分位数为84.1567891011234(3)已知落在[50,60)的平均成绩是56,方差是7,落在[60,70)的平均成绩为65,方差是4,求两组成绩的总平均数和总方差s2.(7分)解:由频率分布直方图知,成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,所以==62;由样本方差计算总体方差公式,得总方差为s2=×{10×[7+(56-62)2]+20×[4+(65-62)2]}=23.1567891011234第二节 用样本估计总体1.会用统计图表对总体进行估计,会求n个数据的第p百分位数. 2.能用数字特征估计总体集中趋势和总体离散程度.教材再回首1.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值. (2)四分位数:第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.2.众数、中位数、平均数(1)众数:一组数据中 的那个数据,叫做这组数据的众数. (2)中位数:把n个数据按大小顺序排列,处于 位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:把 称为a1,a2,…,an这n个数的平均数. 3.标准差与方差设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是s=,s2=[(x1-)2+(x2-)2+…+(xn-)2].4.比例分配的分层随机抽样所获得样本的均值与方差利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为n1,均值为,方差为;第二层的样本量为n2,均值为,方差为,则总的样本均值= ,总的样本方差s2= . 典题细发掘1.(人A必修②P181T1)为了合理调配电力资源,某市欲了解全市50 000户居民的日用电量.若通过简单随机抽样从中抽取了300户进行调查,得到其日用电量的平均数为5.5 kW·h,则可以推测全市居民用户日用电量的平均数 ( )A.一定为5.5 kW·h B.高于5.5 kW·hC.低于5.5 kW·h D.约为5.5 kW·h2.(人A必修②P216T3改编)[多选]在去年的足球联赛上,甲队每场比赛平均失球数是1.5,方差为1.1;乙队每场比赛平均失球数是2.1,方差是0.4,下列说法正确的有 ( )A.平均来说甲队比乙队防守技术好B.乙队比甲队的防守技术更稳定C.每轮比赛甲队的失球数一定比乙队少D.乙队可能有一半的场次不失球3.(人B必修②P70T2改编)计算数据1,2,3,4,5,6,7,8,9,10的40%分位数为 . 4.(苏教必修②P271T10改编)已知数据x1,x2,…,x10的平均数为2,方差为3,那么数据2x1+3,2x2+3,…,2x10+3的平均数和方差分别为 . 题点一 样本数字特征的估计 [例1](1)(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理下表:亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150, 1 200]频数 6 12 18 30 24 10根据表中数据,下列结论中正确的是 ( )A.100块稻田亩产量的中位数小于1 050 kgB.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200 kg至300 kg之间D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间(2)(2023·新课标Ⅰ卷)[多选]有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则 ( )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差|谨记结论|(1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a.(2)数据x1,x2,…,xn与数据x1'=x1+a,x2'=x2+a,…,xn'=xn+a的方差相等,即数据经过平移后方差不变.(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.|思维建模|计算一组数据的第p百分位数的步骤第一步:按从小到大排列原始数据.第二步:计算i=n×p%.第三步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.[即时训练]1.(2025·广州模拟)[多选]已知样本数据7,3,5,3,10,8,则这组数据的 ( )A.众数为3 B.平均数为6.5 C.上四分位数为8 D.方差为2.学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4 000名学生(男、女生人数之比为3∶2)中抽取了一个容量为 100的样本.其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179,用样本估计总体,则该学校学生身高的方差为 . 题点二 频率分布直方图中的数字特征 [例2] 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下频率分布直方图.记C为事件“乙离子残留在体内的百分比不高于5.5”,根据直方图得到P(C)的估计值为0.30.(1)求乙离子残留百分比直方图中a,b的值;(2)求甲离子残留百分比的第75百分位数;(3)估计乙离子残留百分比的平均数.(同一组数据用该组区间的中点值为代表)|思维建模| 用频率分布直方图估计样本的数字特征(1)平均数:=xiSi(xi表示第i个小矩形底边中点的横坐标,Si表示第i个小矩形的面积).(2)方差:s2= (xi-)2·Si.(3)众数:最高小矩形底边中点的横坐标.(4)中位数:把频率分布直方图划分为左、右两个面积相等的部分时,分界线与横轴交点的横坐标.(5)百分位数:类比中位数,百分位数所在垂直于x轴的直线把频率分布直方图划分为左、右两个部分,左边所有矩形的面积和为p%.中位数是第50百分位数.求解公式:已知频率分布直方图的组距为d.①找出百分位数所在的矩形区间[a,b);②第p百分位数=a+d·.[即时训练]3.随着时代不断地进步,人们的生活条件也越来越好,越来越多的人注重自己的身材,其中体脂率是一个很重要的衡量标准.根据一般的成人标准,女性体脂率的正常范围是20%至25%,男性的正常范围是15%至18%.这一范围适用于大多数成年人,可以帮助判断个体是否存在肥胖的风险.某市有关部门对全市100万名成年女性的体脂率进行一次抽样调查统计,抽取了1 000名成年女性的体脂率作为样本绘制频率分布直方图如图.(1)求a;(2)如果女性体脂率为25%至30%属“偏胖”,体脂率超过30%属“过胖”,那么全市女性“偏胖”,“过胖”各约有多少人 (3)小王说:“我的体脂率是调查所得数据的中位数.”小张说:“我的体脂率是调查所得数据的平均数.”那么谁的体脂率更低 题点三 总体离散程度的估计[例3] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:试验序号i 1 2 3 4 5 6 7 8 9 10伸缩率xi 545 533 551 522 575 544 541 568 596 548伸缩率yi 536 527 543 530 560 533 522 550 576 536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.(1)求,s2.(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).|思维建模| 总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.[即时训练]4.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图.(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个的轮胎相对更好 第二节 用样本估计总体课前·“四基”落实[教材再回首]1.(1)p%2.(1)出现次数最多 (2)最中间 (3)4.+ [+(-)2]+[+(-)2][典题细发掘]1.选D 由样本的数字特征与总体的数字特征的关系,可知全市居民用户日用电量的平均数约为5.5 kW·h.2.AB3.解析:将数据从小到大排列后可得1,2,3,4,5,6,7,8,9,10,因为10×40%=4,所以这组数据的40%分位数是=4.5.答案:4.54.7,12课堂·题点精研题点一[例1] (1)C (2)BD(1)根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg,故A错误;亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为=66%,故B错误;稻田亩产量的极差最大约为1 200-900=300,最小约为1 150-950=200,故C正确;由频数分布表可得,100块稻田亩产量的平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.(2)取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为,故A、C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x1,x2,…,x6的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x2,x3,x4,x5的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.故选BD.[即时训练]1.选ACD 首先,我们把数据从小到大排列,得到3,3,5,7,8,10,观察得数据3出现的次数最多,所以众数为3,故A正确;平均数为==6,故B错误;因为一共有6个数据,且6×75%=4.5,所以上四分位数为第5个数,故上四分位数为8,故C正确;方差为[(3-6)2+(3-6)2+(5-6)2+(7-6)2+(8-6)2+(10-6)2]=(9+9+1+1+4+16)=×40=,故D正确.2.解析:根据题意,由于男、女生人数之比为3∶2,则样本中男女生人数之比为3∶2,其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179,则样本的平均数=×175+×160=169,样本的方差s2=×[184+(175-169)2]+×[179+(160-169)2]=236,用样本估计总体,则该学校学生身高的方差为236.答案:236题点二[例2] 解:(1)由已知得0.30=0.05+b+0.15,解得b=0.10,所以a=1-0.20-0.15-0.30=0.35.(2)根据频率分布直方图,易知甲离子残留百分比的第75百分位数在区间[4.5,5.5),设为x,则0.15+0.20+0.30+(x-4.5)×0.20=0.75,解得x=5.0,所以甲离子残留百分比的第75百分位数为5.0.(3)乙离子残留百分比的平均数的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.0.[即时训练]3.解:(1)由频率分布直方图可得5×2a+5×0.03+5×0.07+5×6a+5×2a=1,所以a=0.01.(2)由频率分布直方图可得样本中女性“偏胖”的频率为5×0.06=0.3,样本中女性“过胖”的频率为5×0.02=0.1,所以全市女性“偏胖”的人数约为1 000 000×0.3=300 000,全市女性“过胖”的人数约为1 000 000×0.1=100 000.(3)调查所得数据的平均数为12.5×0.1+17.5×0.15+22.5×0.35+27.5×0.3+32.5×0.1=23.25,即小张的体脂率为23.25%.设调查所得数据的中位数为x,因为0.1+0.15=0.25<0.5,0.1+0.15+0.35=0.6>0.5,所以20所以0.25+(x-20)×0.07=0.5,所以x=≈23.57,即小王的体脂率为23.57%.所以小张的体脂率更低.题点三[例3] 解:(1)由题意,求出zi的值如表所示,试验 序号i 1 2 3 4 5 6 7 8 9 10zi 9 6 8 -8 15 11 19 18 20 12则=×(9+6+8-8+15+11+19+18+20+12)=11,s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)因为2=2=,=11=>,所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.[即时训练]4.解:(1)甲厂10个轮胎宽度的平均数=×(195+194+196+193+194+197+196+195+193+197)=195(mm),乙厂10个轮胎宽度的平均数=×(195+196+193+192+195+194+195+192+195+193)=194(mm).(2)甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195,平均数=×(195+194+196+194+196+195)=195,方差=×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=,乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195,平均数=×(195+196+195+194+195+195)=195,方差=×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=.∵两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,∴乙厂的轮胎相对更好.课时跟踪检测(七十) 用样本估计总体一、单选题1.已知一组数据1,2,3,4,x的下四分位数是x,则x的可能取值为 ( )A.5 B.4C.3 D.22.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则 ( )A.a>b>c B.b>c>aC.c>a>b D.c>b>a3.(2025·贵阳模拟)为了了解某班学生数学成绩,利用分层随机抽样抽取了一个10人的样本,统计如下:学生数 平均分 方差男生 6 80 7女生 4 75 2则可估计全班学生数学的平均分和方差分别为 ( )A.77.5,5 B.77.5,11C.78,5 D.78,114.某老师对比甲、乙两名学生最近5次数学月考成绩,甲:126,137,118,129,140,乙:115,125,117,119,124,则下列结论正确的是 ( )A.甲成绩的平均数较小 B.乙成绩的中位数较大C.乙成绩的极差较大 D.乙比甲的成绩稳定5.在践行“乡村振兴”战略的过程中,某地大力发展特色花卉种植业.某农户种植一种观赏花卉,为了解花卉的长势,随机测量了100枝花卉的高度(单位:cm),得到花卉高度的频率分布直方图,如图所示,则下列说法正确的是 ( )A.样本花卉高度的极差不超过20 cmB.样本花卉高度的中位数不小于众数C.样本花卉高度的平均数不小于中位数D.样本花卉高度小于60 cm的占比不超过70%6.某同学掷一枚正方体骰子5次,记录每次骰子出现的点数,统计出结果的平均数为2,方差为0.4,可判断这组数据的众数为 ( )A.1 B.2C.3 D.4二、多选题7.(2025·大庆一模)为弘扬奥运精神,某学校组织高一年级学生进行奥运专题的答题活动.为了调查男生和女生对奥运会的关注程度,在高一年级随机抽取10名男生和10名女生的竞赛成绩(满分100分),按从低到高的顺序排列,得到下表中的样本数据:男生 82 85 86 87 88 90 90 92 94 96女生 82 84 85 87 87 87 88 88 90 92则下列说法正确的是 ( )A.男生样本数据的25%分位数是86B.男生样本数据的中位数小于男生样本数据的众数C.女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变D.女生样本数据中去掉一个最高分和一个最低分后所得数据的方差不变三、填空题8.(2025·贵阳开学考试)已知一组样本数据1,2,m,6的极差为6,若m>0,则m= ,这组数据的方差为 . 9.互不相等的4个正整数从小到大排序为a1,a2,a3,a4,若它们的平均数为4,且这4个数据的极差是中位数的2倍,则这4个数据的中位数为 . 四、解答题10.(10分)(2025·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲 82 81 79 78 95 88 93 84乙 92 95 80 75 83 80 90 85(1)求两名学生预赛成绩的平均数和方差;(5分)(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪名学生参加合适 请说明理由.(5分)11.(13分)(2025·孝感模拟)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(3分)(2)求样本成绩的第75百分位数;(3分)(3)已知落在[50,60)的平均成绩是56,方差是7,落在[60,70)的平均成绩为65,方差是4,求两组成绩的总平均数和总方差s2.(7分)课时跟踪检测(七十)1.选D 一共有5个数据,5×25%=1.25,故数据的下四分位数为数据从小排到大的第2个数据,所以1≤x≤2.2.选D 数据从小到大排列得10,12,14,14,15,15,16,17,17,17.则有a=×(15+17+14+10+15+17+17+16+14+12)=14.7,b=×(15+15)=15,c=17.所以c>b>a.故选D.3.选D 可估计全班学生数学的平均分为80×+75×=78,方差为[7+(80-78)2]+[2+(75-78)2]=11.故选D.4.选D 设甲、乙成绩的平均数分别为,,方差分别为,,则=×(126+137+118+129+140)=130,=×(115+125+117+119+124)=120,∴>,甲成绩的平均数较大,故A错误;甲成绩的中位数为129,乙成绩的中位数为119,乙成绩的中位数较小,故B错误;甲成绩的极差为140-118=22,乙成绩的极差为125-115=10,乙成绩的极差较小,故C错误;=×[(-4)2+72+(-12)2+(-1)2+102]=62,=×[(-5)2+52+(-3)2+(-1)2+42]=15.2,∴>,乙比甲的成绩稳定,故D正确.5.选D 对于A,由频率分布直方图可知,样本花卉高度的极差为70-40=30(cm),A错误;对于B,样本花卉高度的众数为=57.5(cm),设样本花卉高度的中位数为a cm,前三个矩形的面积和为(0.012+0.028+0.036)×5=0.38,前四个矩形的面积和为0.38+0.056×5=0.66,故a∈(55,60),由中位数的定义可得0.38+(a-55)×0.056=0.5,解得a≈57.14(cm),则a<57.5,所以样本花卉高度的中位数小于众数,B错误;对于C,由频率分布直方图可知,样本花卉高度的平均数为=42.5×0.06+47.5×0.14+52.5×0.18+57.5×0.28+62.5×0.24+67.5×0.1=56.5(cm),则6.选B 不妨设五个点数为x1≤x2≤x3≤x4≤x5,由题意知平均数为2,方差为0.4,则(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2=2,x1+x2+x3+x4+x5=10.可知五次的点数中最大点数不可能为4,5,6.五个点也不可能都是2,则五个点数情况可能是3,3,2,1,1,其方差为×[(3-2)2+(3-2)2+(2-2)2+(1-2)2+(1-2)2]==0.8,不合题意.若五个点数情况为3,2,2,2,1,其方差为×[(3-2)2+(2-2)2+(2-2)2+(2-2)2+(1-2)2]==0.4,符合题意,其众数为2.7.选ABC 10×25%=2.5,所以男生样本数据的25%分位数是86,故A正确;男生样本数据的中位数为=89,男生样本数据的众数为90,故B正确;女生样本数据的平均数为×(82+84+85+87×3+88×2+90+92)=87,女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数为×(84+85+87×3+88×2+90)=87,故C正确;女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变,但是极差变小,所以方差变小,故D错误.8.解析:因为一组样本数据1,2,m,6的极差为6,且m>0,所以m-1=6,解得m=7,则==4,所以方差为s2=[(1-4)2+(2-4)2+(6-4)2+(7-4)2]=(9+4+4+9)=.答案:7 9.解析:由题意可知,a1+a2+a3+a4=16,a4-a1=2×=a2+a3,所以a4=a1+a2+a3=16-a4,解得a4=8,所以a1+a2+a3=8.又因为a1,a2,a3,a4是互不相等的4个正整数从小到大排序的,所以a1=1,a2=2,a3=5或a1=1,a2=3,a3=4,所以这4个数据的中位数为=.答案:10.解:(1)=×(82+81+79+78+95+88+93+84)=85,=×(92+95+80+75+83+80+90+85)=85,=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知=,<,甲的成绩较稳定,所以派甲参赛比较合适.11.解:(1)每组小矩形的面积之和为1,∴(0.005+0.010+0.020+a+0.025+0.010)×10=1,∴a=0.030.(2)成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=0.65,落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,设第75百分位数为m,由0.65+(m-80)×0.025=0.75,得m=84,故第75百分位数为84.(3)由频率分布直方图知,成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,所以==62;由样本方差计算总体方差公式,得总方差为s2=×{10×[7+(56-62)2]+20×[4+(65-62)2]}=23. 展开更多...... 收起↑ 资源列表 第二节 用样本估计总体.pptx 第二节 用样本估计总体.docx 课时跟踪检测(七十) 用样本估计总体.docx