资源简介 第二节 用样本估计总体【课标解读】【课程标准】1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.4.结合实例,能用样本估计总体的取值规律.5.结合实例,能用样本估计百分位数,理解百分位数的统计含义.【核心素养】数学抽象、数学运算、数据分析.【命题说明】考向 考法 高考命题常以频率分布直方图为载体,考查用样本数据估计总体数字特征;数据的众数、中位数、平均数、方差、百分位数是高考热点,常以选择题或解答题的形式出现.预测 预计2025年高考仍会在总体集中趋势、离散程度中出题.百分位数也会是考查的一个热点.【必备知识·逐点夯实】知识梳理·归纳1.总体取值规律的估计(1)常见的统计图表有 条形图 、 扇形图 、 折线图 、 频率分布直方图 等. (2)作频率分布直方图的步骤①求 极差 ; ②决定 组距 与 组数 ; ③将 数据 分组; ④列频率分布表;⑤画频率分布直方图.2.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,且至少有(100-p)%的数据 大于或等于 这个值. 微点拨第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.3.总体集中趋势的估计(1)平均数、中位数和众数的应用数值型数据(如用水量、身高、收入、产量等)集中趋势多用 平均数 、 中位数 描述;分类型数据(如校服规格、性别、产品质量等级等)集中趋势多用 众数 描述. (2)平均数、中位数、众数的求法数字 特征 样本数据 频率分布直方图众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 划分频率分布直方图为左右两个面积相等的分界线与x轴交点的横坐标平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和4.总体离散程度的估计(1)方差、标准差的定义:假设一组数据为x1,x2,…,xn,其平均数为,则方差:s2=(xi-)2或-;标准差:s=.(2)总体(样本)方差①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=(Yi-)2.②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2. 微思考方差、标准差的大小,说明样本数据有怎样的离散关系 提示:样本方差、标准差越大,说明样本数据越分散,否则说明越集中.基础诊断·自测类型 辨析 改编 易错题号 1 2,3 41.(思考辨析)(正确的打“√”,错误的打“×”)(1)对一组数据来说,平均数和中位数总是非常接近.( )(2)方差与标准差具有相同的单位.( )(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( )(4)在频率分布直方图中,最高的小矩形底边中点的横坐标是众数.( )2.(必修第二册P215练习T2)若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为( )A.2 B.4 C.6 D.83.(必修第二册P203例2)某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为( )A.88.5 B.89 C.91 D.89.54.(统计图识别错误)某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 . 【核心考点·分类突破】考点一统计图表的识别[例1](多选题)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2021年1月至2023年12月月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论正确的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解题技法统计图表的主要应用(1)扇形图:直观描述各类数据占总数的比例;(2)折线图:描述数据随时间的变化趋势;(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.对点训练1.已知某地区中小学生的人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本量和该地区的高中生近视人数分别为( )A.200,25 B.200,2 500C.8 000,25 D.8 000,2 5002.走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是( )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的均值大于乙C.这一星期内甲的日步数的方差大于乙D.这一星期内乙的日步数的30%分位数是7 030【补偿训练】(2023·丽水模拟)某校高一年级1 000名学生的血型统计情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用比例分配的分层随机抽样的方法从中抽取一个容量为100的样本,则从高一年级A型血的学生中应抽取的人数是( )A.11 B.22 C.110 D.220考点二离散型数据的数字特征[例2](多选题)(2024·苏州模拟)给定数6,4,3,6,3,8,8,3,1,8,则这组数据的( )A.中位数为5 B.方差为C.平均数为5 D.85%分位数为8解题技法样本数字特征的求法(1)众数是样本数据中出现次数最多的数据.(2)将样本数据按大小顺序排列,处在最中间位置的一个数据(或最中间两个数据的均值)即为中位数.(3)平均数是样本数据的算术平均数.(4)极差是样本数据中最大值与最小值的差.对点训练1.从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为( )A.92,85 B.92,88 C.95,88 D.96,852.(多选题)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:396 275 268 225 168 166 176 173 188 168 141 157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是( )A.极差 B.中位数 C.众数 D.平均数【补偿训练】 某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为( )A.102 B.103 C.109.5 D.116[例3](多选题)在某次单元测试中,4 000名考生的考试成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )A.成绩在[70,80)分的考生人数最多B.考生考试成绩的第80百分位数为83.3C.考生考试成绩的平均分约为70.5分D.考生考试成绩的中位数为75分解题技法频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.(4)第p百分位数: ①确定第p百分位数所在的区间[a,b],②确定小于a和小于b的数据所占的百分比fa%,fb%,则第p百分位数为a+×(b-a).对点训练(2024·长沙模拟)某校1 000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )A.频率分布直方图中a的值为0.004B.估计这20名学生考试成绩的第60百分位数为75C.估计这20名学生考试成绩的众数为80D.估计总体中成绩落在内的学生人数为150【补偿训练】 某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分.考点四总体离散趋势的估计[例4](2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如表:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解题技法计算方差、标准差的步骤(1)求出样本数据的平均数;(2)计算每个样本数据与样本平均数的差xi-(i=1,2,…,n),并求对应的平方值;(3)求出上述n个平方值的平均数,即为样本方差;求出上述n个平方值平均数的算术平方根,即为样本标准差.对点训练1.(2023·成都模拟)一次数学考试后,某班级平均分为110分,方差为.现发现有两名同学的成绩计算有误,甲同学成绩被误判为113分,实际得分为118分;乙同学成绩误判为120分,实际得分为115分.更正后重新计算,得到方差为,则与的大小关系为( )A.= B.> C.< D.不能确定2.(多选题)(2021·新高考Ⅱ卷)下列统计量中可用于度量样本x1,x2,…,xn离散程度的有( )A. x1,x2,…,xn的标准差B. x1,x2,…,xn的中位数C. x1,x2,…,xn的极差D. x1,x2,…,xn的平均数【补偿训练】1.(2023·天津模拟)已知一组样本数据x1,x2,…,xn(x1A.平均数 B.中位数 C.极差 D.方差2.某学校有男生400人,女生600人.为了调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为 . 第二节 用样本估计总体【课标解读】【课程标准】1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.4.结合实例,能用样本估计总体的取值规律.5.结合实例,能用样本估计百分位数,理解百分位数的统计含义.【核心素养】数学抽象、数学运算、数据分析.【命题说明】考向 考法 高考命题常以频率分布直方图为载体,考查用样本数据估计总体数字特征;数据的众数、中位数、平均数、方差、百分位数是高考热点,常以选择题或解答题的形式出现.预测 预计2025年高考仍会在总体集中趋势、离散程度中出题.百分位数也会是考查的一个热点.【必备知识·逐点夯实】知识梳理·归纳1.总体取值规律的估计(1)常见的统计图表有 条形图 、 扇形图 、 折线图 、 频率分布直方图 等. (2)作频率分布直方图的步骤①求 极差 ; ②决定 组距 与 组数 ; ③将 数据 分组; ④列频率分布表;⑤画频率分布直方图.2.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,且至少有(100-p)%的数据 大于或等于 这个值. 微点拨第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.3.总体集中趋势的估计(1)平均数、中位数和众数的应用数值型数据(如用水量、身高、收入、产量等)集中趋势多用 平均数 、 中位数 描述;分类型数据(如校服规格、性别、产品质量等级等)集中趋势多用 众数 描述. (2)平均数、中位数、众数的求法数字 特征 样本数据 频率分布直方图众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 划分频率分布直方图为左右两个面积相等的分界线与x轴交点的横坐标平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和4.总体离散程度的估计(1)方差、标准差的定义:假设一组数据为x1,x2,…,xn,其平均数为,则方差:s2=(xi-)2或-;标准差:s=.(2)总体(样本)方差①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=(Yi-)2.②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2. 微思考方差、标准差的大小,说明样本数据有怎样的离散关系 提示:样本方差、标准差越大,说明样本数据越分散,否则说明越集中.基础诊断·自测类型 辨析 改编 易错题号 1 2,3 41.(思考辨析)(正确的打“√”,错误的打“×”)(1)对一组数据来说,平均数和中位数总是非常接近.( × )提示:(1)一组数据如果出现极端值,其平均数与中位数不会接近,例如:1 000,0,0,0,0,所以(1)错误;(2)方差与标准差具有相同的单位.( × )提示: (2)因为标准差是方差的算术根,其单位不一样,所以(2)错误;(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( √ )提示: (3)因为一组数中每个数减去同一个非零常数,则这组数的平均数改变,每个数与平均数的差值不变,所以方差不变,所以(3)正确;(4)在频率分布直方图中,最高的小矩形底边中点的横坐标是众数.( √ )提示: (4)因为在频率分布直方图中,最高的小矩形底边中点的横坐标为众数,所以(4)正确.2.(必修第二册P215练习T2)若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为( )A.2 B.4 C.6 D.8【解析】选D.根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.3.(必修第二册P203例2)某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为( )A.88.5 B.89 C.91 D.89.5【解析】选B.7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.4.(统计图识别错误)某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 . 【解析】因为初中部女教师占70%,高中部女教师占40%,所以该校女教师的人数为120×0.7+150×0.4=84+60=144.答案:144【核心考点·分类突破】考点一统计图表的识别[例1](多选题)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2021年1月至2023年12月月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论正确的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【解析】选BCD.对于选项A,由题图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察题中折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,观察题中折线图,各年的月接待游客量高峰期大致在7,8月份,故C正确;对于D选项,观察题中折线图,各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D正确.解题技法统计图表的主要应用(1)扇形图:直观描述各类数据占总数的比例;(2)折线图:描述数据随时间的变化趋势;(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.对点训练1.已知某地区中小学生的人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本量和该地区的高中生近视人数分别为( )A.200,25 B.200,2 500C.8 000,25 D.8 000,2 500【解析】选B.由扇形分布图并结合比例分配的分层随机抽样知识易知样本量为=200,则样本中高中生的人数为200×25%=50,易知该地区高中生人数为=5 000,结合近视率条形图得该地区高中生近视的人数为5 000×50%=2 500.2.走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是( )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的均值大于乙C.这一星期内甲的日步数的方差大于乙D.这一星期内乙的日步数的30%分位数是7 030【解析】选D.对于A,这一星期内甲的日步数从小到大为2 435,7 965,9 500,11 600,12 700,16 000,16 800,所以中位数为11 600,选项A正确;对于B,计算甲的平均数为=×(2 435+7 965+9 500+11 600+12 700+16 000+16 800)=11 000,乙的平均数为=×(14 200+12 300+7 030+12 970+5 340+11 600+10 060)=10 500,所以甲的日步数的均值大于乙,选项B正确;对于C,甲有极端值,对方差的影响大,所以甲的日步数的方差大于乙,选项C正确;对于D,因为7×30%=2.1,所以乙的日步数的30%分位数是从小到大的第3个数,为10 060,选项D错误.【补偿训练】(2023·丽水模拟)某校高一年级1 000名学生的血型统计情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用比例分配的分层随机抽样的方法从中抽取一个容量为100的样本,则从高一年级A型血的学生中应抽取的人数是( )A.11 B.22 C.110 D.220【解析】选B.由题图中数据可知高一年级A型血的学生人数占高一年级学生总人数的22%,所以抽取一个容量为100的样本,从A型血的学生中应抽取的人数是100×22%=22.考点二离散型数据的数字特征[例2](多选题)(2024·苏州模拟)给定数6,4,3,6,3,8,8,3,1,8,则这组数据的( )A.中位数为5 B.方差为C.平均数为5 D.85%分位数为8【解析】选ACD.将数6,4,3,6,3,8,8,3,1,8按从小到大的顺序排列为1,3,3,3,4,6,6,8,8,8,则这组数据的中位数为=5,故A正确;平均数为=5,故C正确;则方差为[++×3+×3+×2]=5.8,故B错误;因为10×85%=8.5,所以85%分位数是从小到大第9个数字为8,故D正确.解题技法样本数字特征的求法(1)众数是样本数据中出现次数最多的数据.(2)将样本数据按大小顺序排列,处在最中间位置的一个数据(或最中间两个数据的均值)即为中位数.(3)平均数是样本数据的算术平均数.(4)极差是样本数据中最大值与最小值的差.对点训练1.从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为( )A.92,85 B.92,88 C.95,88 D.96,85【解析】选B.数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,10×25%=2.5,取第三个数,所以第25百分位数是88.2.(多选题)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:396 275 268 225 168 166 176 173 188 168 141 157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是( )A.极差 B.中位数 C.众数 D.平均数【解析】选ABD.根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,发生改变;加入数据前,中位数为×(173+176)=174.5,加入数据后,中位数为176,发生改变;众数为数据中出现次数最多的数,不会改变;若加入数据前,平均数为,加入数据后,平均数为>,发生改变.【补偿训练】 某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为( )A.102 B.103 C.109.5 D.116【解析】选C.这组数据已经按照由小到大的顺序排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为=109.5.考点三频率分布直方图的数字特征[例3](多选题)在某次单元测试中,4 000名考生的考试成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )A.成绩在[70,80)分的考生人数最多B.考生考试成绩的第80百分位数为83.3C.考生考试成绩的平均分约为70.5分D.考生考试成绩的中位数为75分【解析】选ABC.根据题图得,成绩出现在[70,80)的频率最大,故A正确;考生考试成绩的第80百分位数为80+×10≈83.3,故B正确;根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生考试成绩的中位数为70+×10≈71.67,故D错误.解题技法频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.(4)第p百分位数: ①确定第p百分位数所在的区间[a,b],②确定小于a和小于b的数据所占的百分比fa%,fb%,则第p百分位数为a+×(b-a).对点训练(2024·长沙模拟)某校1 000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )A.频率分布直方图中a的值为0.004B.估计这20名学生考试成绩的第60百分位数为75C.估计这20名学生考试成绩的众数为80D.估计总体中成绩落在内的学生人数为150【解析】选D.由10×=1可得a=0.005,故A错误;前三个矩形的面积和为10×=0.6,所以这20名学生考试成绩的第60百分位数为80,故B错误;这20名学生考试成绩的众数为75,故C错误;总体中成绩落在内的学生人数为3a×10×1 000=150,故D正确.【补偿训练】 某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;【解析】(1)设分数在[70,80)内的频率为x,根据频率分布直方图,可得(0.01+0.015+0.02+0.025+0.005)×10+x=1,解得x=0.25,所以分数在[70,80)内的频率为0.25,补全这个频率分布直方图,如图所示.(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分.【解析】(2)因为分数在区间[80,90)内的频率为0.25,在区间[90,100]内的频率为0.05,而0.05<10%<0.25+0.05,所以设排名前10%的分界点为90-a,则0.025a+0.005×10=10%,解得a=2,所以排名前10%的分界点为88分,即获奖的学生至少需要88分.考点四总体离散趋势的估计[例4](2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如表:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;【解析】(1)由题表中的数据可得,=×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10.0,=×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,=×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,=×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【解析】(2)由(1)中数据得-=0.3,2=2,显然->2 ,所以新设备生产产品的该项指标的均值较旧设备有显著提高.解题技法计算方差、标准差的步骤(1)求出样本数据的平均数;(2)计算每个样本数据与样本平均数的差xi-(i=1,2,…,n),并求对应的平方值;(3)求出上述n个平方值的平均数,即为样本方差;求出上述n个平方值平均数的算术平方根,即为样本标准差.对点训练1.(2023·成都模拟)一次数学考试后,某班级平均分为110分,方差为.现发现有两名同学的成绩计算有误,甲同学成绩被误判为113分,实际得分为118分;乙同学成绩误判为120分,实际得分为115分.更正后重新计算,得到方差为,则与的大小关系为( )A.= B.> C.< D.不能确定【解析】选B.设班级人数为n,因为113+120=118+115,所以更正前后平均分不变,且(113-110)2+(120-110)2>(118-110)2+(115-110)2,所以>.2.(多选题)(2021·新高考Ⅱ卷)下列统计量中可用于度量样本x1,x2,…,xn离散程度的有( )A. x1,x2,…,xn的标准差B. x1,x2,…,xn的中位数C. x1,x2,…,xn的极差D. x1,x2,…,xn的平均数【解析】选AC.由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数无法度量数据的离散程度;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数无法度量数据的离散程度.【补偿训练】1.(2023·天津模拟)已知一组样本数据x1,x2,…,xn(x1A.平均数 B.中位数 C.极差 D.方差【解析】选A.对于A项,新数据的总数为++…+=x1+x2+…+xn,与原数据总数一样,且数据数量不变,都是n,故平均数不变,故A正确;对于B项,不妨设原数据为1,2.5,3,中位数为2.5,则新数据为1.75,2.75,2,中位数为2,显然中位数变了,故B错误;对于C项,原数据极差为xn-x1,新数据极差为-,因为--(xn-x1)=<0,极差变小了,故C错误;对于D项,由于两组数据的平均数不变,而极差变小,说明新数据相对原数据更集中于平均数,故方差变小,即D错误.2.某学校有男生400人,女生600人.为了调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为 . 【解析】由题意,总体的均值为×7.5+×7=7.2,根据分层抽样的性质,则总体的方差为×[1+(7.5-7.2)2]+×[0.5+(7-7.2)2]=0.436+0.324=0.76.答案:0.76 展开更多...... 收起↑ 资源列表 第十章 第二节 用样本估计总体 - 学生版 .docx 第十章 第二节 用样本估计总体.docx