第2节 用样本的数字特征估计总体(课件 学案 练习)2027届高考数学一轮复习 第九章

资源下载
  1. 二一教育资源

第2节 用样本的数字特征估计总体(课件 学案 练习)2027届高考数学一轮复习 第九章

资源简介

第2节 用样本的数字特征估计总体
(时间:60分钟,满分:96分)
[备注:单选、填空题5分,多选题6分]
1.已知一组样本数据1,2,2,3,4,5,则2.5是该组数据的(  )
A.极差 B.平均数
C.中位数 D.众数
                                                 
                                                 
                                                 
2.已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的第30百分位数、第80百分位数分别相等,则=(  )
A. B.
C. D.
                                                 
                                                 
                                                 
3.某校高一年级开设了校本课程,现从甲、乙两班各随机抽取了5名学生校本课程的学分,统计如下表所示,s1,s2分别表示甲、乙两班抽取的5名学生校本课程学分的标准差,则(  )
甲 8 11 14 15 22
乙 6 7 10 23 24
A.s1>s2
B.s1<s2
C.s1=s2
D.s1,s2的大小不能确定
                                                 
                                                 
4.(2026·湖北武汉二调)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,
下列说法中正确的是(  )
A.a=0.05 B.评分的众数估值为70
C.评分的第25百分位数估值为67.5 D.评分的平均数估值为76
                                                 
5.〔多选〕甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
下列结论中正确的是(  )
A.甲、乙两班学生成绩的平均水平相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班的成绩比乙班的成绩波动大
D.甲班成绩的众数小于乙班成绩的众数
                                                 
                                                 
6.〔多选〕(2026·河南焦作模拟)有一组样本数据a,b,c,d,其中a>b>c>d,由这组数据得到的新样本数据为a-2,b-2,c+2,d+2,则(  )
A.两组数据的极差一定相等
B.两组数据的平均数一定相等
C.两组数据的中位数可能相等
D.两组数据的方差不可能相等
                                                 
                                                 
                                                 
7.某工厂新、旧两条生产线的产量比为7∶3,为了解该工厂生产的一批产品的质量情况,采用比例分配的分层随机抽样的方法从两条生产线抽取样本并计算得:新生产线生产的产品的质量指标的均值为10,方差为1;旧生产线生产的产品的质量指标的均值为9,方差为2,据此估计该批产品的质量指标的均值为    ,方差为    .
                                                 
                                                 
                                                 
8.某射击运动员连续射击5次,命中的环数(环数为整数)形成一组数据,这组数据的中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为    .
                                                 
                                                 
9.(13分)一家水果店的店长为了解本店荔枝的日销售情况,安排两位员工分别记录并整理了6月份上、下半月荔枝的日销售量(单位:千克).结果如下:(已按从小到大的顺序排列)
上半月:55 70 75 80 80 84 84 85 86 89 91 94 96 99 104
下半月:74 75 83 85 85 87 93 94 97 99 101 102 107 107 117
(1)请计算该水果店6月份荔枝日销量的中位数、极差;
(2)一次进货太多,卖不完的荔枝第二天就会不新鲜;进货太少,又不能满足顾客的需求,店长希望在荔枝销售期间,每天的荔枝尽量新鲜,又能有80%的天数可以满足顾客的需求.请问:每天应该进多少千克荔枝?
10.已知4个不全相等的正整数的平均数与中位数都是2,则这组数据的极差为(  )
A.4 B.3
C.2 D.1
                                                 
                                                 
11.现有十个点的坐标为(x1,0),(x2,0),…,(x10,0),它们分别与(y1,10),(y2,10),…,(y10,10)关于点(3,5)对称,已知x1,x2,…,x10的平均数为a,中位数为b,方差为c,极差为d,则y1,y2,…,y10这组数满足(  )
A.平均数为6+a B.中位数为b-6
C.方差为6-c D.极差为d
                                                 
12.某同学掷骰子5次,分别记录每次骰子出现的点数,根据5次的统计结果,可以判断一定没有出现点数6的是(  )
A.中位数是3,众数是2
B.平均数是3,中位数是2
C.方差是2.4,平均数是2
D.平均数是3,众数是2
                                                 
                                                 
13.〔多选〕(2023·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
                                                 
                                                 
14.已知一组样本数据共有8个数,其平均数为8,方差为12,将这组样本数据增加两个未知的数据构成一组新的样本数据,已知新的样本数据的平均数为9,则新的样本数据的方差最小值为    .
                                                 
                                                 
15.(15分)某网络公司为了提升服务质量,从会员库中随机抽取n名会员进行线上问卷调查,将会员的评分(满分10分)从低到高分为四个等级:
会员 评分 [4,5) [5,6) [6,7) [7,8) [8,9) [9,10]
满意 等级 不满意 一般 满意 非常 满意
并绘制出如图所示的频率分布直方图.已知调查评分在[7,8)的会员数为40人.
(1)求样本容量n及频率分布直方图中的t值;
(2)若该公司以抽取的样本为参考,每组数据以该组评分的区间中点值为代表进行评估.
①若会员满意度评分的均值低于8分,则需要提升公司产品的体验感,否则全力开发新产品.根据所学的统计知识,判断该公司应采用的运营策略,并说明理由;
②记会员评分的样本标准差为s,试估计会员总体在区间[-s,+s)的人数的百分比.(参考数据:1.292≈1.66,1.312≈1.72,1.322≈1.74,1.332≈1.77)
第2节 用样本的数字特征估计总体
1.C 2.A 3.B 4.C 5.ABC 
6.BC 对于A,假设原样本数据为5,4,2,1,则新样本数据为3,2,4,3,两组数据的极差不相等,A错误;对于B,因为a-2+b-2+c+2+d+2=a+b+c+d,所以两组数据的平均数一定相等,B正确;对于C,由A中的数据可知两组数据的中位数可能相等,C正确;对于D,假设原样本数据为4,3,2,1,则新样本数据为2,1,4,3,这两组数据一样,故方差可能相等,D错误.故选B、C.
7.9.7 1.51 
8.7.8 解析:依题意,这组数据一共有5个数,中位数为8,则从小到大排列,8的前面有2个数,后面也有2个数,又唯一的众数为9,则有两个9,其余数字均只出现一次,则最大数字为9,又极差为3,所以最小数字为6,所以这组数据为6,7,8,9,9,所以平均数为=7.8.
9.解:(1)将所有数据从小到大排列:
55,70,74,75,75,80,80,83,84,84,85,85,85,86,87,89,91,93,94,94,96,97,99,99,101,102,104,107,107,117,
中位数为第15,16个数的平均数,即(87+89)÷2=88,
极差为117-55=62.
(2)80%×30=24,数据从小到大排列,第24,25个数据分别为99,101,=100.
所以每天应该进100千克荔枝.
10.C 设这四个不全相等的正整数为x1,x2,x3,x4,不妨设x1≤x2≤x3≤x4,则=2,=2,x2+x3=4,所以x1+x4=4,由于x1,x4是正整数,所以x1=1,x4=3,(若x1=x4=2,则x2=x3=2,与已知4个数不全相等矛盾)所以极差为3-1=2.故选C.
11.D 由于(x1,0),(x2,0),…,(x10,0)分别与(y1,10),(y2,10),…,(y10,10)关于点(3,5)对称,则有xi+yi=6(i∈Z,1≤i≤10),即有yi=6-xi(i∈Z,1≤i≤10).则由平均数的性质可得y1,y2,…,y10这组数的平均数为6-a,结合中位数性质可知中位数为6-b,结合方差性质可得方差为c,极差为数据最大值与最小值的差,假设x1最小,x10最大,则d=x10-x1,则y1,y2,…,y10中的最大值为6-x1,最小值为6-x10,故极差为(6-x1)-(6-x10)=x10-x1=d.故选D.
12.C 对于A,当掷骰子出现的结果为2,2,3,5,6时,满足中位数为3,众数为2,可以出现点数6,故A不正确;对于B,当掷骰子出现结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点数6,故B不正确;对于C,若平均数为2,且出现点数6,则方差s2>(6-2)2=3.2>2.4,所以当平均数为2,方差为2.4时,一定不会出现点数6,故C正确;对于D,当掷骰子出现结果为2,2,2,3,6时,满足平均数为3,众数为2,可以出现点数6,故D不正确.故选C.
13.BD 若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数为,1,2,3,4,5,8的平均数为,两组数据的平均数不相等,故A错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D正确.故选B、D.
14.13.6 解析:设增加的数为x,y,原来的8个数分别为a1,a2,…,a8,则a1+a2+…+a8=64,a1+a2+…+a8+x+y=90,所以x+y=26,又因为(ai-8)2=12,即(ai-8)2=96,新的样本数据的方差为[(ai-9)2+(x-9)2+(y-9)2]=[(ai-8)2-2(ai-8)+8+(x-9)2+(y-9)2]=(x2+y2-202),因为≥=13,x2+y2-202≥136,所以方差的最小值为13.6(当且仅当x=y=13时取到最小值).
15.解:(1)由频率分布直方图可知,评分在[7,8)的频率f=1×0.20=0.2,
故样本容量n==200.
又(t+0.06+0.10+0.20+6t+0.36)×1=1,故t=0.04.
(2)各组评分的区间中点值分别为4.5,5.5,6.5,7.5,8.5,9.5.
①会员满意度评分的均值=4.5×0.04+5.5×0.06+6.5×0.10+7.5×0.20+8.5×0.36+9.5×0.24=8,
故该公司应全力开发新产品.
②因为方差s2=(4.5-8)2×0.04+(5.5-8)2×0.06+(6.5-8)2×0.10+(7.5-8)2×0.20+(8.5-8)2×0.36+(9.5-8)2×0.24=1.77,则s≈1.33,
故-s≈6.67,+s≈9.33.
区间[6,7)内评分不小于6.67的频率m满足=,解得m=0.033,
区间[9,10)内评分不大于9.33的频率n满足=,即n=0.079 2,
所以样本在区间[-s,+s)的频率为m+0.20+0.36+n=0.672 2,
因此用样本估计总体知,所有会员在区间[-s,+s)的人数的百分比约为67.22%.
1 / 1第2节 用样本的数字特征估计总体
1.能用样本估计总体的集中趋势参数(平均数、中位数、众数)、离散程度参数(标准差、方差、极差),理解集中趋势参数和离散程度参数的统计含义. 2.能用样本估计总体的取值规律和百分位数,理解百分位数的统计含义. 3.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知识梳理
1.总体百分位数的估计
(1)百分位数
定义 意义
百分位数 一组数据的第p百分位数是这样一个值,它使得这组数据中                       有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值 反映该组数中小于或等于该百分位数的分布特点
(2)求一组n个数据的第p百分位数的步骤
第1步:按从小到大排列原始数据;
第2步:计算i=     ;
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第   项数据;若i是整数,则第p百分位数为第i项与第     项数据的平均数.
2.总体集中趋势的估计
名称 概念
平均数 (1)平均数:如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=         ; (2)加权平均数:如果总体的N个变量值中,不同的值共有k(k≤N)个.不妨记为y1,y2,…,yk,其中yi出现的频数为fi(i=1,2,…,k),则加权平均数为=fiyi; (3)分层随机抽样的平均数:若一组数据是由分层随机抽样所得到的,其中第一层抽取m个,即x1,x2,…,xm,平均数为,第二层抽取n个,即y1,y2,…,yn,平均数为,则x1,x2,…,xm,y1,y2,…,yn的平均数=+
中位数 将一组数据按从小到大或从大到小的顺序排列,处在     的一个数据(数据个数是奇数)或最中间两个数据的     (数据个数是偶数)叫做这组数据的中位数
众数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)叫做这组数据的众数
提醒:(1)中位数是样本数据所占频率的等分线,不受少数极端值影响;(2)众数体现了样本数据的最大集中点,一组数据可能有n个众数,也可能没有众数;(3)与中位数、众数比较,平均数反映出样本数据的更多信息,对样本数据中的少数极端值更加敏感.
3.总体离散程度的估计
名称 概念
标准差与方差 设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是s=, s2=[(x1-)2+(x2-)2+…+(xn-)2]
总体方差和总 体标准差 (1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=        ,S=为总体标准差; (2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=                       , S=为总体标准差
分层随机抽样 的方差 分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为,样本方差为s2,其中第一层抽取m个数据的平均数为,方差为,第二层抽取n个数据的平均数为,方差为,则该组数据的方差s2={m[+(-)2]+n[+(-)2]}
1.频率分布直方图中的常见结论 (1)众数的估计值为最高矩形底边的中点对应的横坐标;(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;(3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广 (1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a; (2)数据x1,x2,…,xn与数据x'1=x1+a,x'2=x2+a,…,x'n=xn+a的方差相等,即数据经过平移后方差不变; (3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.
诊断自测
1.判断正误.(正确的画“√”,错误的画“×”)
(1)平均数、众数与中位数从不同角度描述了一组数据的集中趋势.(  )
(2)一组数据的中位数必为其中一个数.(  )
(3)方差越大,数据越集中.(  )
(4)方差与标准差具有相同的单位.(  )
(5)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(  )
2.〔多选〕在下列统计量中,用来描述一组数据离散程度的量是(  )
A.平均数 B.众数
C.极差 D.标准差
3.(2026·河南新乡名校模拟)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是(  )
A.86,84 B.84.5,85
C.85,84 D.86.5,84
4.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为(  )
A.88.5 B.89
C.91 D.89.5
5.已知一组数据1,3,2,5,4,则这组数据的标准差为    .
总体百分位数的估计
(基础自学过关)
1.已知一组数据1,2,3,4,x的75%分位数是x,则x的取值范围为(  )
A.{3} B.[2,3]
C.[3,4] D.{4}
2.某工厂随机抽取部分工人,对他们某天生产的产品件数进行了统计,统计数据如表所示,则该组数据的产品件数的第60百分位数是(  )
件数 7 8 9 10 11
人数 3 6 5 4 2
A.8.5 B.9 C.9.5 D.10
3.(2025·河北唐山模拟)某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为(  )
A.220 B.240
C.250 D.300
4.为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了某地区1 000名学生每天进行体育运动的时间,按照时长(单位:min)分成6组:第一组[30,40),第二组[40,50),第三组[50,60),第四组[60,70),第五组[70,80),第六组[80,90],经整理得到如图所示的频率分布直方图,则可以估计该地区学生每天体育活动时间的第25百分位数约为    .
1.总体百分位数的估计需要注意的两个问题 (1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键; (2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值. 2.由频率分布直方图求第p百分位数的方法 确定要求的p%分位数所在分组[A,B),由频率分布表或频率分布直方图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=A+组距×.
总体集中趋势的估计
(师生共研过关)
(1)〔多选〕某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是(  )
A.频率分布直方图中第三组的频数为10
B.根据频率分布直方图估计样本的众数为75分
C.根据频率分布直方图估计样本的中位数为75分
D.根据频率分布直方图估计样本的平均数为75分
(2)(2026·浙江金华模拟)一组不全相等的数据,去掉一个最大值,则下列数字特征一定改变的是(  )
A.极差 B.中位数
C.平均数 D.众数
听课记录
1.求平均数时要注意数据的个数,不要重计或漏计. 2.求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数. 3.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数. 提醒:中位数、众数分别反映了一组数据的中等水平、多数水平,平均数反映了数据的平均水平,我们需要根据实际需求选择使用.
训练1 (1)某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的极差、众数和中位数分别是(  )
环数 5 6 7 8 9 10
人数 1 2 7 6 3 1
A.6,7,7 B.6,8,7.5
C.5,7,7.5 D.5,8,6
(2)〔多选〕如图所示的频率分布直方图显示了三种不同的分布形态.图1形成对称形态,图2形成“右拖尾”形态,图3形成“左拖尾”形态,根据所给图作出以下判断,正确的是(  )
A.图1的平均数=中位数=众数
B.图2的平均数<众数<中位数
C.图2的众数<中位数<平均数
D.图3的平均数<中位数<众数
总体离散程度的估计
(定向精析突破)
考向1 方差与标准差
(1)为庆祝中国共产主义青年团成立100周年,某区举办了团课知识竞赛,甲、乙两所中学各派5名学生参加,两队学生的竞赛成绩如图所示,下列关系完全正确的是(  )
A.<,= B.=,>
C.>,= D.=,<
(2)(2026·江西赣州模拟)若一组样本数据x1,x2,…,x8的方差为2,(-1)ixi=-2,yi=xi+(-1)i(i=1,2,…,8),则样本数据y1,y2,…,y8的方差为(  )
A.1 B.2
C.2.5 D.2.75
听课记录
  标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大,越不稳定;标准差(方差)越小,数据的离散程度越小,越稳定.
考向2 分层随机抽样的方差与标准差
(2026·浙江温州模拟)某班级有30名男生和20名女生,现调查学生周末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周末在家学习时长的平均值和方差s2的值分别是(  )
A.=9.5,s2=1.5 B.=9,s2=1.5
C.=9.5,s2=3 D.=9,s2=3
听课记录
计算分层随机抽样的方差的步骤 (1)确定,,,; (2)确定; (3)应用公式s2=[+(-)2]+·[+(-)2],计算s2.
训练2 (1)若样本数据x1,x2,x3,…,x10的标准差为4,则数据1-2x1,1-2x2,1-2x3,…,1-2x10的标准差为(  )
A.4 B.8 C.16 D.64
(2)在高一入学时,某班班委统计了本班所有同学中考的体育成绩,并计算出平均分和方差.后来又转学来一位同学.若该同学中考的体育成绩恰好等于这个班级原来所有同学中考体育成绩的平均分,则下列说法正确的是(  )
A.班级平均分不变,方差变小
B.班级平均分不变,方差变大
C.班级平均分改变,方差变小
D.班级平均分改变,方差变大
(3)〔一题多解〕已知15个数x1,x2,…,x15的平均数为6,方差为9,现从中剔除x1,x2,x3,x4,x5这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数x6,x7,…,x15的方差为    .
第2节 用样本的数字特征估计总体
【夯实必备知识】
知识梳理
1.(1)至少 (2)n×p% j (i+1)
2.(x1+x2+…+xn) 最中间 平均数
3.(Yi-)2 fi(Yi-)2
诊断自测
1.(1)√ (2)× (3)× (4)× (5)√
2.CD 3.D 4.B 5.
【研透核心考点】
考点1
1.C 2.B 3.B 4.47.5 
考点2
【例1】 (1)ABC (2)C 解析:(1)分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73(分),故D错误.
(2)对于A,去掉最大值后,新极差为原次大值与最小值之差,若原次大值等于最大值,则极差不变,若原次大值不等于最大值,则极差改变,故A错误;对于B,去掉最大值后,中位数可能改变,可能不变,如原数据为1,2,2,3,中位数为2,去掉3后,数据为1,2,2,中位数还是2,故B错误;对于C,设原平均数为S=,且x1,x2,…,xn按照从小到大的顺序,假设去掉最大值xn后平均数不变,则S=,所以S=,解得S=xn,由于原数据不全相等,则S<xn,故矛盾,所以平均数一定改变,故C正确;对于D,众数不一定改变,如数据为2,2,3,4,众数为2,去掉4后,众数仍为2,故D错误.故选C.
训练1 (1)C (2)ACD 解析:(1)从表中数据可知极差为10-5=5,成绩为7环的有7人,人数最多,所以众数是7;中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,所以中位数是=7.5.
(2)图1所示的频率分布直方图是对称的,所以平均数=中位数=众数,故A正确;图2众数最小,右拖尾平均数大于中位数,故B错误,C正确;图3左拖尾众数最大,平均数小于中位数,故D正确.故选A、C、D.
考点3
【例2】 (1)B (2)C 解析:(1)根据题意得:甲所中学5名学生的成绩为70,80,80,70,90,乙所中学5名学生的成绩为60,70,70,60,80,∴=×(70+80+80+70+90)=78,=×(60+70+70+60+80)=68,=×[(70-78)2+(80-78)2+(80-78)2+(70-78)2+(90-78)2]=56,=×[(60-68)2+(70-68)2+(70-68)2+(60-68)2+(80-68)2]=56,∴=,>.故选B.
(2)设样本数据x1,x2,…,x8的平均数为,则(xi-)2=2,设样本数据y1,y2,…,y8的平均数为,由yi=xi+(-1)i(i=1,2,…,8),则=,所以(yi-)2=[xi+(-1)i-]2=2+(-1)i(xi-)+1=3+(-1)ixi=3+×(-2)=2.5.故选C.
【例3】 D =×8+×=+=9,s2=×[2+(9-8)2]+×[0.75+(9-10.5)2]=3.故选D.
训练2 (1)B (2)A (3)8
解析:(1)设一组样本数据x1,x2,…,xn的方差为s2,则数据y1,y2,…,yn(其中yi=axi+b,i=1,2,…,n)的方差s'2=a2s2.由题意,样本数据x1,x2,x3,…,x10的方差为16,所以1-2x1,1-2x2,1-2x3,…,1-2x10的方差为(-2)2×16=64,即标准差为8.
(2)设该班原来有n位同学,这n位同学中考体育成绩的平均分和方差分别为x,y,则转学来一位同学后,该班所有同学中考体育成绩的平均分==x,方差s2=×(yn+0)=y-<y,所以转学来一位同学后,班级平均分不变,方差变小.故选A.
(3)法一(定义法) 由题意知,x1+x2+…+x15=15×6=90,x1+x2+…+x5=5×8=40,所以x6+x7+…+x15=90-40=50,所以剩余的10个数的平均数为=5.根据方差公式s2=(xi-)2=(-n)得,++…+-15×62=15×9,++…+-5×82=5×5,即++…+=675,++…+=345,所以++…+=675-345=330,所以剩余的10个数的方差为×(330-10×52)=8.
法二(公式法) 把剔除的5个数作为第一层,其平均数为8,方差为5;把剩余的10个数作为第二层,易求其平均数为5,方差设为,代入s2={m[+(-)2]+n[+(-)2]}可得:9=[5+(8-6)2]+[+(5-6)2],解得:=8.
1 / 1(共76张PPT)
第2节 用样本的数字特征估计总体
课标要求
1. 能用样本估计总体的集中趋势参数(平均数、中位数、众数)、离散程度参数(标准差、方差、极差),理解集中趋势参数和离散程度参数的统计含义.
2. 能用样本估计总体的取值规律和百分位数,理解百分位数的统计含义.
3. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
目录/
CONTENTS
夯实必备知识
01
研透核心考点
02
课时跟踪检测
03
01
PART
夯实必备知识
知识梳理
1. 总体百分位数的估计
(1)百分位数
定义 意义
百分 位数 一组数据的第p百分位数是这样一个值,
它使得这组数据中 有p%的数据
小于或等于这个值,且至少有(100-
p)%的数据大于或等于这个值 反映该组数中小于
或等于该百分位数
的分布特点
至少 
(2)求一组n个数据的第p百分位数的步骤
第1步:按从小到大排列原始数据;
第2步:计算i= ;
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第
项数据;若i是整数,则第p百分位数为第i项与第 项数据的
平均数.
n×p% 
j 
(i+1) 
2. 总体集中趋势的估计
名称 概念
平均数 (1)平均数:如果有n个数x1,x2,…,xn,那么 (x1+x2
+…+xn)就是这组数据的平均数,用 表示,即 =

(2)加权平均数:如果总体的N个变量值中,不同的值共有k(k≤N)个.不妨记为y1,y2,…,yk,其中yi出现的频数为fi(i=1,2,…,k),则加权平均数为 = fiyi;
(3)分层随机抽样的平均数:若一组数据是由分层随机抽样所得到的,其中第一层抽取m个,即x1,x2,…,xm,平均数为 ,第二层抽取n个,即y1,y2,…,yn,平均数为 ,则x1,x2,…,xm,y1,y2,…,yn的平均数 = +
(x1
+x2+…+xn) 
名称 概念
中位数 将一组数据按从小到大或从大到小的顺序排列,处在
的一个数据(数据个数是奇数)或最中间两个数据
的 (数据个数是偶数)叫做这组数据的中位数
众数 一组数据中出现次数最多的数据(即频数最大值所对应的样
本数据)叫做这组数据的众数
最中
间 
平均数 
提醒:(1)中位数是样本数据所占频率的等分线,不受少数极端值影
响;(2)众数体现了样本数据的最大集中点,一组数据可能有n个众数,
也可能没有众数;(3)与中位数、众数比较,平均数反映出样本数据的
更多信息,对样本数据中的少数极端值更加敏感.
3. 总体离散程度的估计
名称 概念
标准差与 方差 设一组数据x1,x2,x3,…,xn的平均数为 ,则这组数据
的标准差和方差分别是s=

s2= [(x1- )2+(x2- )2+…+(xn- )2]
名称 概念
总体方差 和总体标 准差 (1)一般式:如果总体中所有个体的变量值分别为Y1,
Y2,…,YN,总体平均数为 ,则总体方差S2=
,S= 为总体标准差;
(2)加权式:如果总体的N个变量值中,不同的值共有k
(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频
数为fi(i=1,2,…,k),则总体方差为S2=
,S= 为总体标准差
(Yi- )2 
fi
(Yi- )2 
名称 概念
分层随机 抽样的方差 分层随机抽样中,如果样本量是按比例分配,记总的样本
平均数为 ,样本方差为s2,其中第一层抽取m个数据的
平均数为 ,方差为 ,第二层抽取n个数据的平均数为
,方差为 ,则该组数据的方差s2= {m[+(
- )2]+n[+( - )2]}
1. 频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;(2)平均
数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边
中点的横坐标之和;(3)中位数的估计值的左边和右边的小矩形的面
积和是相等的.
2. 平均数、方差的公式推广
(1)若x1,x2,…,xn的平均数为 ,那么mx1+a,mx2+a,…,mxn
+a的平均数为m +a;
(2)数据x1,x2,…,xn与数据x'1=x1+a,x'2=x2+a,…,x'n=xn+
a的方差相等,即数据经过平移后方差不变;
(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b
的方差为a2s2.
诊断自测
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)平均数、众数与中位数从不同角度描述了一组数据的集中趋势.
( √ )
(2)一组数据的中位数必为其中一个数. ( × )
(3)方差越大,数据越集中. ( × )
(4)方差与标准差具有相同的单位. ( × )
(5)如果一组数中每个数减去同一个非零常数,则这组数的平均数改
变,方差不变. ( √ )

×
×
×

2. 〔多选〕在下列统计量中,用来描述一组数据离散程度的量是(  )
A. 平均数 B. 众数
C. 极差 D. 标准差


解析:  极差是一组数据中最大值与最小值的差,标准差反映了数
据离散程度的大小,因此都是用来描述一组数据离散程度的统计量,
故选C、D.
3. (2026·河南新乡名校模拟)已知在高考前最后一次模拟考试中,高三
某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该
组数据的平均数和众数分别是(  )
A. 86,84 B. 84.5,85
C. 85,84 D. 86.5,84

解析:  将样本数据按升序排列为79,84,84,84,86,87,93,95,
可得平均数 = =86.5,因为84出现次数最多,所以
众数为84.
4. 某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则
这7次成绩的第80百分位数为(  )
A. 88.5 B. 89 C. 91 D. 89.5

解析:  因为7次的训练成绩从小到大排列为85,86,87,88,88,89,
90,且7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6
个数据,即89.
5. 已知一组数据1,3,2,5,4,则这组数据的标准差为 .
解析:由题意得 = ×(1+3+2+5+4)=3,s2= ×[(1-3)2+(3
-3)2+(2-3)2+(5-3)2+(4-3)2]=2,∴s= .
 
02
PART
研透核心考点
总体百分位数的估计(基础自学过关)
1. 已知一组数据1,2,3,4,x的75%分位数是x,则x的取值范围为
(  )
A. {3} B. [2,3]
C. [3,4] D. {4}

解析:  在五个数中,75%分位数为第二大的数,故1,2,3,4,x中第
二大的数是x,所以3≤x≤4.故选C.
2. 某工厂随机抽取部分工人,对他们某天生产的产品件数进行了统计,统
计数据如表所示,则该组数据的产品件数的第60百分位数是(  )
件数 7 8 9 10 11
人数 3 6 5 4 2
A. 8.5 B. 9
C. 9.5 D. 10

解析:  抽取的工人总数为20,20×60%=12,那么第60百分位数是所
有数据从小到大排序后的第12项与第13项数据的平均数,第12项与第13项
数据分别为9,9,所以第60百分位数是9.故选B.
3. (2025·河北唐山模拟)某校高三年级一共有1 200名同学参加数学测
验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分
的人数至少为(  )
A. 220 B. 240
C. 250 D. 300

解析:  ∵1 200×80%=960,∴小于103分的学生最多有960人,则数学
成绩不小于103分的学生至少有1 200-960=240(人).
4. 为了解“双减”政策实施后学生每天的体育
活动时间,研究人员随机调查了某地区1 000名
学生每天进行体育运动的时间,按照时长(单
位:min)分成6组:第一组[30,40),第二
组[40,50),第三组[50,60),第四组[60,70),第五组[70,80),第六组[80,90],经整理得到如图所示的频率分布直方图,则可以估计该地区学生每天体育活动时间的第25百分位数约为 .
47.5 
解析:由10×0.01=0.1<0.25,10×0.01+10×0.02=0.3>0.25,故第
25百分位数位于[40,50)内,则第25百分位数为40+ ×10=
47.5,可以估计该地区学生每天体育活动时间的第25百分位数约为47.5.
1. 总体百分位数的估计需要注意的两个问题
(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是
关键;
(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体
百分位数的估计一般是估计值而非精确值.
2. 由频率分布直方图求第p百分位数的方法
确定要求的p%分位数所在分组[A,B),由频率分布表或频率分布直方
图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=
A+组距× .
总体集中趋势的估计(师生共研过关)
(1)〔多选〕某城市在创建文明城市的活动中,为了解居民对“创
建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100
分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.
现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部
分图形,如图所示.观察图形,则下列说法正确的是( ABC )
ABC
A. 频率分布直方图中第三组的频数为10
B. 根据频率分布直方图估计样本的众数为75分
C. 根据频率分布直方图估计样本的中位数为75分
D. 根据频率分布直方图估计样本的平均数为75分
解析: 分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+
0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;
因为众数的估计值是频率分布直方图中最高矩形底边中点的横坐标,从图
中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)
×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,
所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=
0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的
估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)
+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73
(分),故D错误.
(2)(2026·浙江金华模拟)一组不全相等的数据,去掉一个最大值,则
下列数字特征一定改变的是( C )
A. 极差 B. 中位数
C. 平均数 D. 众数
C
解析:对于A,去掉最大值后,新极差为原次大值与最小值之差,若原次
大值等于最大值,则极差不变,若原次大值不等于最大值,则极差改变,
故A错误;对于B,去掉最大值后,中位数可能改变,可能不变,如原数据
为1,2,2,3,中位数为2,去掉3后,数据为1,2,2,中位数还是2,故
B错误;对于C,设原平均数为S= ,且x1,x2,…,xn按照从
小到大的顺序,假设去掉最大值xn后平均数不变,则S= ,所
以S= ,解得S=xn,由于原数据不全相等,则S<xn,故矛盾,所
以平均数一定改变,故C正确;对于D,众数不一定改变,如数据为2,2,
3,4,众数为2,去掉4后,众数仍为2,故D错误.故选C.
1. 求平均数时要注意数据的个数,不要重计或漏计.
2. 求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位
数是这两个数据的平均数.
3. 若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数
据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.
提醒:中位数、众数分别反映了一组数据的中等水平、多数水平,平均数
反映了数据的平均水平,我们需要根据实际需求选择使用.
训练1 (1)某射击小组有20人,教练将他们某次射击的数据绘制成如下表
格,则这组数据的极差、众数和中位数分别是( C )
环数 5 6 7 8 9 10
人数 1 2 7 6 3 1
A. 6,7,7 B. 6,8,7.5
C. 5,7,7.5 D. 5,8,6
解析: 从表中数据可知极差为10-5=5,成绩为7环的有7人,人数
最多,所以众数是7;中位数是将数据从小到大排列,第10个与第11个数
据的平均数,第10个数是7,第11个数是8,所以中位数是 =7.5.
C
(2)〔多选〕如图所示的频率分布直方图显示了三种不同的分布形态.图
1形成对称形态,图2形成“右拖尾”形态,图3形成“左拖尾”形态,根
据所给图作出以下判断,正确的是( ACD )
A. 图1的平均数=中位数=众数
B. 图2的平均数<众数<中位数
C. 图2的众数<中位数<平均数
D. 图3的平均数<中位数<众数
ACD
解析: 图1所示的频率分布直方图是对称的,所以平均数=中位数=
众数,故A正确;图2众数最小,右拖尾平均数大于中位数,故B错误,C
正确;图3左拖尾众数最大,平均数小于中位数,故D正确.故选A、C、D.
总体离散程度的估计(定向精析突破)
考向1 方差与标准差
(1)为庆祝中国共产主义青年团成立100周年,某区举办了团课知识
竞赛,甲、乙两所中学各派5名学生参加,两队学生的竞赛成绩如图所
示,下列关系完全正确的是( B )
B
A. < , =
B. = , >
C. > , =
D. = , <
解析: 根据题意得:甲所中学5名学生的成绩为70,80,80,70,90,乙
所中学5名学生的成绩为60,70,70,60,80,∴ = ×(70+80+80
+70+90)=78, = ×(60+70+70+60+80)=68, =
×[(70-78)2+(80-78)2+(80-78)2+(70-78)2+(90-78)
2]=56, = ×[(60-68)2+(70-68)2+(70-68)2+(60-68)
2+(80-68)2]=56,∴ = , > .故选B.
(2)(2026·江西赣州模拟)若一组样本数据x1,x2,…,x8的方差为2,
(-1)ixi=-2,yi=xi+(-1)i(i=1,2,…,8),则样本数据
y1,y2,…,y8的方差为( C )
A. 1 B. 2
C. 2.5 D. 2.75
C
解析:设样本数据x1,x2,…,x8的平均数为 ,则 (xi- )2=2,
设样本数据y1,y2,…,y8的平均数为 ,由yi=xi+(-1)i(i=1,
2,…,8),则 = ,所以 (yi- )2= [xi+(-1)i- ]2=
2+ (-1)i(xi- )+1=3+ (-1)ixi=3+ ×(-2)=
2.5.故选C.
  标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准
差(方差)越大,数据的离散程度越大,越不稳定;标准差(方差)越
小,数据的离散程度越小,越稳定.
考向2 分层随机抽样的方差与标准差
(2026·浙江温州模拟)某班级有30名男生和20名女生,现调查学生周
末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差
为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周
末在家学习时长的平均值 和方差s2的值分别是( D )
A. =9.5,s2=1.5 B. =9,s2=1.5
C. =9.5,s2=3 D. =9,s2=3
解析:  = ×8+ × = + =9,s2= ×[2+(9-
8)2]+ ×[0.75+(9-10.5)2]=3.故选D.
D
计算分层随机抽样的方差的步骤
(1)确定 , , , ;
(2)确定 ;
(3)应用公式s2= [+( - )2]+ [+( - )2],
计算s2.
训练2 (1)若样本数据x1,x2,x3,…,x10的标准差为4,则数据1-
2x1,1-2x2,1-2x3,…,1-2x10的标准差为( B )
A. 4 B. 8
C. 16 D. 64
解析: 设一组样本数据x1,x2,…,xn的方差为s2,则数据y1,y2,…,
yn(其中yi=axi+b,i=1,2,…,n)的方差s'2=a2s2.由题意,样本数
据x1,x2,x3,…,x10的方差为16,所以1-2x1,1-2x2,1-2x3,…,1
-2x10的方差为(-2)2×16=64,即标准差为8.
B
(2)在高一入学时,某班班委统计了本班所有同学中考的体育成绩,并
计算出平均分和方差.后来又转学来一位同学.若该同学中考的体育成绩恰
好等于这个班级原来所有同学中考体育成绩的平均分,则下列说法正确的
是( A )
A. 班级平均分不变,方差变小
B. 班级平均分不变,方差变大
C. 班级平均分改变,方差变小
D. 班级平均分改变,方差变大
A
解析:设该班原来有n位同学,这n位同学中考体育成绩的平均分和方差
分别为x,y,则转学来一位同学后,该班所有同学中考体育成绩的平均
分 = =x,方差s2= ×(yn+0)=y- <y,所以转学来
一位同学后,班级平均分不变,方差变小.故选A.
(3)〔一题多解〕已知15个数x1,x2,…,x15的平均数为6,方差为9,
现从中剔除x1,x2,x3,x4,x5这5个数,且剔除的这5个数的平均数为8,
方差为5,则剩余的10个数x6,x7,…,x15的方差为 .
8 
解析:法一(定义法) 由题意知,x1+x2+…+x15=15×6=90,x1+x2
+…+x5=5×8=40,所以x6+x7+…+x15=90-40=50,所以剩余的10
个数的平均数为 =5.根据方差公式s2= (xi- )2= ( -
n )得, + +…+ -15×62=15×9, + +…+ -
5×82=5×5,即 + +…+ =675, + +…+ =345,所
以 + +…+ =675-345=330,所以剩余的10个数的方差为 ×
(330-10×52)=8.
法二(公式法) 把剔除的5个数作为第一层,其平均数为8,方差为5;
把剩余的10个数作为第二层,易求其平均数为5,方差设为 ,代入s2=
{m[+( - )2]+n[+( - )2]}可得:9= [5+(8
-6)2]+ [+(5-6)2],解得: =8.
03
PART
课时跟踪检测
(时间:60分钟,满分:96分)
[备注:单选、填空题5分,多选题6分]
1. 已知一组样本数据1,2,2,3,4,5,则2.5是该组数据的(  )
A. 极差 B. 平均数
C. 中位数 D. 众数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

解析:  由题意得众数为2,极差为5-1=4,平均数为 =
,中位数为 =2.5.
2. 已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,
39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的第30百
分位数、第80百分位数分别相等,则 =(  )
A. B.
C. D.

解析:  因为30%×6=1.8,大于1.8的比邻整数为2,所以第30百分位
数为n=28,80%×6=4.8,大于4.8的比邻整数为5,所以第80百分位数
为m=48,所以 = = .故选A.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
3. 某校高一年级开设了校本课程,现从甲、乙两班各随机抽取了5名学生
校本课程的学分,统计如下表所示,s1,s2分别表示甲、乙两班抽取的5名
学生校本课程学分的标准差,则(  )
甲 8 11 14 15 22
乙 6 7 10 23 24
A. s1>s2
B. s1<s2
C. s1=s2
D. s1,s2的大小不能确定

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解析:  甲班抽取的5名学生校本课程学分的平均数 = ×(8+11+
14+15+22)=14,乙班抽取的5名学生校本课程学分的平均数 = ×
(6+7+10+23+24)=14.甲班抽取的5名学生校本课程学分的方差 =
×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)
2]=22,∴s1= ,乙班抽取的5名学生校本课程学分的方差 =
×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]
=62,∴s2= .∴s1<s2.故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
4. (2026·湖北武汉二调)某批产品检验后的评分,由统计结果制成如图
所示的频率分布直方图,
下列说法中正确的是(  )
A. a=0.05
B. 评分的众数估值为70
C. 评分的第25百分位数估值为67.5
D. 评分的平均数估值为76

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解析:  由题意得10(2a+3a+4a+5a+6a)=1,解得a=0.005,
A错误;平均数为0.1×55+0.15×95+0.2×65+0.3×75+0.25×85=
76.5,故D错误;众数为 =75,故B错误;因为0.1+0.2=0.3,第25
百分位数估计为60+10× =67.5,故C正确.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
5. 〔多选〕甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字
的个数经统计计算后填入下表:
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
下列结论中正确的是(  )
A. 甲、乙两班学生成绩的平均水平相同
B. 乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为
优秀)
C. 甲班的成绩比乙班的成绩波动大
D. 甲班成绩的众数小于乙班成绩的众数



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解析:  甲、乙两班学生成绩的平均数都是135,故两班学生成绩的
平均水平相同,∴A正确;甲、乙两班人数相同,但甲班成绩的中位数为
149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个
的人数要多于甲班,∴B正确; =191>110= ,∴甲班成绩不如乙班
稳定,即甲班成绩波动较大,∴C正确;由题表看不出两班学生成绩的众
数,∴D不正确.故选A、B、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6. 〔多选〕(2026·河南焦作模拟)有一组样本数据a,b,c,d,其中a
>b>c>d,由这组数据得到的新样本数据为a-2,b-2,c+2,d+
2,则(  )
A. 两组数据的极差一定相等
B. 两组数据的平均数一定相等
C. 两组数据的中位数可能相等
D. 两组数据的方差不可能相等


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解析:  对于A,假设原样本数据为5,4,2,1,则新样本数据为3,
2,4,3,两组数据的极差不相等,A错误;对于B,因为a-2+b-2+c
+2+d+2=a+b+c+d,所以两组数据的平均数一定相等,B正确;对
于C,由A中的数据可知两组数据的中位数可能相等,C正确;对于D,假
设原样本数据为4,3,2,1,则新样本数据为2,1,4,3,这两组数据一
样,故方差可能相等,D错误.故选B、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
7. 某工厂新、旧两条生产线的产量比为7∶3,为了解该工厂生产的一批产
品的质量情况,采用比例分配的分层随机抽样的方法从两条生产线抽取样
本并计算得:新生产线生产的产品的质量指标的均值为10,方差为1;旧
生产线生产的产品的质量指标的均值为9,方差为2,据此估计该批产品的
质量指标的均值为 ,方差为 .
解析:根据两条生产线的产量比为7∶3,且新生产线质量指标的均值为
10,方差为1,旧生产线质量指标的均值为9,方差为2,计算该批产品的
质量指标的均值为 = ×10+ ×9=9.7,s2= ×{7×[1+(10-
9.7)2]+3×[2+(9-9.7)2]}=1.51.
9.7 
1.51 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
8. 某射击运动员连续射击5次,命中的环数(环数为整数)形成一组数
据,这组数据的中位数为8,唯一的众数为9,极差为3,则该组数据的平
均数为 .
解析:依题意,这组数据一共有5个数,中位数为8,则从小到大排列,8
的前面有2个数,后面也有2个数,又唯一的众数为9,则有两个9,其余数
字均只出现一次,则最大数字为9,又极差为3,所以最小数字为6,所以
这组数据为6,7,8,9,9,所以平均数为 =7.8.
7.8 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
9. (13分)一家水果店的店长为了解本店荔枝的日销售情况,安排两位员
工分别记录并整理了6月份上、下半月荔枝的日销售量(单位:千克).结
果如下:(已按从小到大的顺序排列)
上半月:55 70 75 80 80 84 84 85 86 89 91 94 96 99 
104
下半月:74 75 83 85 85 87 93 94 97 99 101 102 107 
107 117
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(1)请计算该水果店6月份荔枝日销量的中位数、极差;
解: 将所有数据从小到大排列:
55,70,74,75,75,80,80,83,84,84,85,85,85,86,87,89,
91,93,94,94,96,97,99,99,101,102,104,107,107,117,
中位数为第15,16个数的平均数,即(87+89)÷2=88,
极差为117-55=62.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(2)一次进货太多,卖不完的荔枝第二天就会不新鲜;进货太少,又不
能满足顾客的需求,店长希望在荔枝销售期间,每天的荔枝尽量新鲜,又
能有80%的天数可以满足顾客的需求.请问:每天应该进多少千克荔枝?
解: 80%×30=24,数据从小到大排列,第24,25个数据分别为
99,101, =100.
所以每天应该进100千克荔枝.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10. 已知4个不全相等的正整数的平均数与中位数都是2,则这组数据的极
差为(  )
A. 4 B. 3
C. 2 D. 1

解析:  设这四个不全相等的正整数为x1,x2,x3,x4,不妨设
x1≤x2≤x3≤x4,则 =2, =2,x2+x3=4,所以x1+
x4=4,由于x1,x4是正整数,所以x1=1,x4=3,(若x1=x4=2,则x2=
x3=2,与已知4个数不全相等矛盾)所以极差为3-1=2.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
11. 现有十个点的坐标为(x1,0),(x2,0),…,(x10,0),它们分
别与(y1,10),(y2,10),…,(y10,10)关于点(3,5)对称,已
知x1,x2,…,x10的平均数为a,中位数为b,方差为c,极差为d,则
y1,y2,…,y10这组数满足(  )
A. 平均数为6+a B. 中位数为b-6
C. 方差为6-c D. 极差为d

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解析:  由于(x1,0),(x2,0),…,(x10,0)分别与(y1,
10),(y2,10),…,(y10,10)关于点(3,5)对称,则有xi+yi=6
(i∈Z,1≤i≤10),即有yi=6-xi(i∈Z,1≤i≤10).则由平均数的
性质可得y1,y2,…,y10这组数的平均数为6-a,结合中位数性质可知中
位数为6-b,结合方差性质可得方差为c,极差为数据最大值与最小值的
差,假设x1最小,x10最大,则d=x10-x1,则y1,y2,…,y10中的最大值
为6-x1,最小值为6-x10,故极差为(6-x1)-(6-x10)=x10-x1=
d.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
12. 某同学掷骰子5次,分别记录每次骰子出现的点数,根据5次的统计结
果,可以判断一定没有出现点数6的是(  )
A. 中位数是3,众数是2
B. 平均数是3,中位数是2
C. 方差是2.4,平均数是2
D. 平均数是3,众数是2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解析:  对于A,当掷骰子出现的结果为2,2,3,5,6时,满足中位数
为3,众数为2,可以出现点数6,故A不正确;对于B,当掷骰子出现结果
为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点数6,故B
不正确;对于C,若平均数为2,且出现点数6,则方差s2> (6-2)2=
3.2>2.4,所以当平均数为2,方差为2.4时,一定不会出现点数6,故C正
确;对于D,当掷骰子出现结果为2,2,2,3,6时,满足平均数为3,众
数为2,可以出现点数6,故D不正确.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
13. 〔多选〕(2023·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,x6,其
中x1是最小值,x6是最大值,则(  )
A. x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B. x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C. x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D. x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解析:  若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数
为 ,1,2,3,4,5,8的平均数为 ,两组数据的平均数不相等,故A
错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于
x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,
2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差
大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-
x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D
正确.故选B、D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
14. 已知一组样本数据共有8个数,其平均数为8,方差为12,将这组样本
数据增加两个未知的数据构成一组新的样本数据,已知新的样本数据的平
均数为9,则新的样本数据的方差最小值为 .
解析:设增加的数为x,y,原来的8个数分别为a1,a2,…,a8,则a1+
a2+…+a8=64,a1+a2+…+a8+x+y=90,所以x+y=26,又因为
(ai-8)2=12,即 (ai-8)2=96,新的样本数据的方差为
[(ai-9)2+(x-9)2+(y-9)2]= [(ai-8)2-2 (ai
-8)+8+(x-9)2+(y-9)2]= (x2+y2-202),因为
≥ =13,x2+y2-202≥136,所以方差的最小值为13.6(当且仅当x
=y=13时取到最小值).
13.6 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
15. (15分)某网络公司为了提升服务质量,从会员库中随机抽取n名
会员进行线上问卷调查,将会员的评分(满分10分)从低到高分为四
个等级:
会员 评分 [4,5) [5,6) [6,7) [7,8) [8,9) [9,10]
满意 等级 不满意 一般 满意 非常
满意
并绘制出如图所示的频率分布直方图.已知调查评分在[7,8)的会员数为40人.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(1)求样本容量n及频率分布直方图中的t值;
解: 由频率分布直方图可知,评分在[7,8)
的频率f=1×0.20=0.2,
故样本容量n= =200.
又(t+0.06+0.10+0.20+6t+0.36)×1=1,
故t=0.04.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
①若会员满意度评分的均值 低于8分,则需要提升公司产品的体验感,否
则全力开发新产品.根据所学的统计知识,判断该公司应采用的运营策
略,并说明理由;
②记会员评分的样本标准差为s,试估计会员总体在区间[-s, +s)
的人数的百分比.(参考数据:1.292≈1.66,1.312≈1.72,
1.322≈1.74,1.332≈1.77)
(2)若该公司以抽取的样本为参考,每组数据以该组评分的区间中点值
为代表进行评估.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解: 各组评分的区间中点值分别为4.5,5.5,
6.5,7.5,8.5,9.5.
①会员满意度评分的均值 =4.5×0.04+
5.5×0.06+6.5×0.10+7.5×0.20+8.5×0.36+
9.5×0.24=8,
故该公司应全力开发新产品.
②因为方差s2=(4.5-8)2×0.04+(5.5-8)2×0.06+(6.5-8)2×0.10+(7.5-8)2×0.20+(8.5-8)2×0.36+(9.5-8)2×0.24=1.77,则s≈1.33,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
故 -s≈6.67, +s≈9.33.
区间[6,7)内评分不小于6.67的频率m满足 = ,解得m=
0.033,
区间[9,10)内评分不大于9.33的频率n满足 = ,即n=0.0792,
所以样本在区间[-s, +s)的频率为m+0.20+0.36+n=0.672 2,
因此用样本估计总体知,所有会员在区间[-s, +s)的人数的百分比
约为67.22%.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
THANKS
演示完毕 感谢观看

展开更多......

收起↑

资源列表