第2节 用样本估计总体 学案(Word版含答案)

资源下载
  1. 二一教育资源

第2节 用样本估计总体 学案(Word版含答案)

资源简介

第2节 用样本估计总体
知识梳理
1.画频率分布直方图的步骤
(1)求极差:极差是一组数据中最大值与最小值的差.
(2)决定组距与组数:当样本容量不超过100时,常分成5~12组,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表:一般分四列,即分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是1.
(5)画频率分布直方图:横轴表示样本数据,纵轴表示.小长方形的面积=组距×=频率.各小长方形的面积和等于1.
2.其它统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
3.总体百分位数的估计
(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
4.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s=,
s2=[(x1-)2+(x2-)2+…+(xn-)2].
1.频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,那么
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
诊断自测
1.判断下列结论正误(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(  )
(2)一组数据的方差越大,说明这组数据越集中.(  )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.(  )
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(  )
答案 (1)√ (2)× (3)√ (4)√
解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.
(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×=频率.
2.下列一组数据的第25百分位数是(  )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
答案 A
解析 把该组数据按照由小到大排列,可得:
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
由i=10×25%=2.5,不是整数,则第3个数据3.2是第25百分位数.
3.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
答案 A
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,
∴中位数是=91.5,
平均数==91.5.
4.(2020·全国Ⅱ卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者(  )
A.10名 B.18名 C.24名 D.32名
答案 B
解析 由题意,第二天完成积压订单及当日订单的配货的概率不小于0.95,即第二天确保完成新订单1600份,减去超市每天能完成的1200份,再加上积压的500份,共有1600-1200+500=900(份),至少需要志愿者900÷50=18(名).
5.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(  )
A.0.01 B.0.1 C.1 D.10
答案 C
解析 10x1,10x2,…,10xn的方差为102×0.01=1.故选C.
6.(2020·新高考海南卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是(  )
A.62% B.56% C.46% D.42%
答案 C
解析 如图,用Venn图表示该中学喜欢足球和游泳的学生所占的比例之间的关系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为x,则(60%-x)+(82%-x)+x=96%,解得x=46%.故选C.
考点一 频率分布直方图
【例1】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90].并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60.
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
感悟升华 1.频率分布直方图的性质.
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)小长方形的高=.
2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
【训练1】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频率分布表
满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 2 8 14 10 6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户和满意度分为三个等级:
满意度评分 低于70分 70分到89分 不低于90分
满意度等级 不满意 满意 非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 (1)作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:“A地区用户的满意度等级为不满意”;
CB表示事件:“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,
P(CB)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
考点二 统计图表及应用
角度1 扇形图
【例2】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:
则下面结论中不正确的是(  )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.
法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.
角度2 折线图
【例3】(多选题)(2021·海南质检)刘女士的网店经营坚果类食品,2019年各月份的收入、支出(单位:百元)情况的统计如图所示,下列说法中正确的是(  )
A.4至5月份的收入的变化率与11至12月份的收入的变化率相同
B.支出最高值与支出最低值的比是5∶1
C.第三季度平均收入为5000元
D.利润最高的月份是3月份和10月份
答案 ACD
解析 对于A,4至5月份的收入的变化率为=-20,11至12月份收入的变化率为=-20,故相同,A正确.
对于B,支出最高值是2月份60百元,支出最低值是5月份的10百元,故支出最高值与支出最低值的比是6∶1,故B错误.
对于C,第三季度的7,8,9月每个月的收入分别为40百元,50百元,60百元,故第三季度的平均收入为=50(百元),故C正确.
对于D,利润最高的月份是3月份和10月份都是30百元,故D正确.
感悟升华 1.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.
2.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.                  
【训练2】 (1)(2021·洛阳模拟)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为(  )
A.200,20 B.100,20
C.200,10 D.100,10
(2)(多选题)(2020·济南模拟)某同学在微信上查询到近十年全国高考报名人数、录取人数和山东夏季高考报名人数的折线图,其中2019年的录取人数被遮挡了.他又查询到近十年全国高考录取率的散点图,结合图表中的信息判定下列说法正确的是(  )
A.全国高考报名人数逐年增加
B.2018年全国高考录取率最高
C.2019年高考录取人数约820万
D.2019年山东高考报名人数在全国的占比最小
答案 (1)A (2)BCD
解析 (1)由图①得样本容量为(3500+2000+4500)×2%=10000×2%=200,
抽取的高中生人数为2000×2%=40(人),
则近视人数为40×0.5=20(人),故选A.
(2)2016年的人数少于2015年人数,故A错误;2018年的录取率为81.1%,为最高,B正确;2019年高考录取人数为1031×79.5%≈820,故C正确;从2010~2019年山东高考报名人数在全国的占比分别为:6.9%,6.3%,5.6%,5.5%,5.9%,7.4%,6.4%,6.2%,6.1%,5.4%,故D正确.
考点三 样本的数字特征
【例4】 (1)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(  )
A.中位数 B.平均数
C.方差 D.极差
(2)(多选题)(2021·武汉调研)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的统计表如下表所示,
甲 乙
环数 4 5 6 7 8 5 6 9
频数 1 1 1 1 1 3 1 1
下列说法正确的有(  )
A.甲成绩的平均数小于乙成绩的平均数
B.甲成绩的中位数等于乙成绩的中位数
C.甲成绩的方差小于乙成绩的方差
D.甲成绩的极差等于乙成绩的极差
答案 (1)A (2)CD
解析 (1)中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.
(2)由表中数据,得甲=×(4+5+6+7+8)=6,
乙=×(5×3+6+9)=6,
所以甲=乙,A错误;
甲成绩的中位数是6,乙成绩的中位数是5,
所以甲成绩的中位数大于乙成绩的中位数,B错误;
s=×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,
s=×[3×(5-6)2+(6-6)2+(9-6)2]=2.4,
所以s甲成绩的极差为8-4=4,乙成绩的极差为9-5=4,
所以甲成绩的极差等于乙成绩的极差,D正确.
(3)12名跳高运动员参加一项校际比赛,成绩分别为1.70,1.65,1.68,1.69,1.72,1.59,1.60,1.67,1.74,1.78,1.55,1.75(单位:m),则比赛成绩的75%分位数是________.
答案 1.73
解析 将12个数据按从小到大排序:
1.55,1.59,1.60,1.65,1.67,1.68,1.69,1.70,1.72,1.74,1.75,1.78,
计算i=12×75%=9,所以比赛成绩的75%分位数是第9个数据与第10个数据的平均数,即=1.73.
感悟升华 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【训练3】 (1)(2021·重庆诊断)“平均增长量”是指一段时间内某一数据指标增长量的平均值,其计算方法是将每一期增长量相加后,除以期数,即.国内生产总值(GDP)被公认为是衡量国家经济状况的最佳指标,下表是我国2015—2019年GDP数据:
年份 2015 2016 2017 2018 2019
国内生产总值/万元 68.89 74.64 83.20 91.93 99.09
根据表中数据,2015—2019年我国GDP的平均增长量为(  )
A.5.03万亿元 B.6.04万亿元
C.7.55万亿元 D.10.07万亿元
(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
甲 10 8 9 9 9
乙 10 10 7 9 9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
答案 (1)C (2)甲
解析 (1)由题意知,2015—2019年我国GDP增长量之和为99.09-68.89=30.2(万亿元),所以2015—2019年我国GDP的平均增长量为=7.55(万亿元),故选C.
(2)由题意可得甲=乙=9,
又∵s=×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=,
s=×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=>s,∴甲更稳定,故最佳人选应是甲.
(3)下表为12名毕业生的起始月薪:
毕业生 起始月薪 毕业生 起始月薪
1 2 850 7 2 890
2 2 950 8 3 130
3 3 050 9 2 940
4 2 880 10 3 325
5 2 755 11 2 920
6 2 710 12 2 880
根据表中所给的数据计算第85百分位数.
解 将12个数据按从小到大排序:2 710,2 755,2 850,2 880,2 880,2 890,2 920,2 940,2 950,3 050,3 130,3 325.
计算i=12×85%=10.2,所以所给数据的第85百分位数是第11个数据3 130.
A级 基础巩固
一、选择题                   
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是(  )
A.45 B.50 C.55 D.60
答案 B
解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.
∴该班学生人数n==50.
2.如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是(  )
A.-2 B.0
C.1 D.2
答案 D
解析 由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,
因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是=2.
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(  )
A.10 B.18 C.20 D.36
答案 B
解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.故选B.
4.(多选题)(2020·重庆诊断)2020年春节前后,一场突如其来的新冠肺炎疫情在全国蔓延.疫情就是命令,防控就是责任.在党中央的坚强领导和统一指挥下,全国人民众志成城,团结一心,掀起了一场坚决打赢疫情防控阻击战的人民战争.下面的图表展示了2月14日至29日全国新冠肺炎疫情数据的变化情况,根据该折线图,可知下列结论正确的是(  )
A.16天中每日新增确诊病例数量呈下降趋势且19日的降幅最大
B.16天中每日新增确诊病例数量的中位数小于新增疑似病例数量的中位数
C.16天中新增确诊、新增疑似、新增治愈病例数量的极差均大于2000
D.19日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例数量之和
答案 BC
解析 由折线图可知,20日新增确诊病例数量大于19日新增确诊病例数量,因此A项不正确;
16天中每日新增确诊病例数量的中位数小于新增疑似病例数量的中位数,因此B项正确;
16天中新增确诊、新增疑似、新增治愈病例数量的极差均大于2000,因此C项正确;
20日新增治愈病例数量小于新增确诊与新增疑似病例数量之和,因此D不正确.故选B、C.
5.(2020·全国大联考)近年来,随着4G网络的普及和智能手机的更新换代,各种方便的App相继出世,其功能也是五花八门.某大学为了调查在校大学生使用App的主要用途,随机抽取了56290名大学生进行调查,各主要用途与对应的人数的结果统计如图所示.
现有如下说法:
①可以估计使用App主要听音乐的大学生人数多于主要看社区、新闻、资讯的大学生人数;
②可以估计不足10%的大学生使用App主要玩游戏;
③可以估计使用App主要找人聊天的大学生超过总数的.
其中正确的个数为(  )
A.0 B.1 C.2 D.3
答案 C
解析 使用App主要听音乐的人数为5380,使用App主要看社区、新闻、资讯的人数为4450,所以①正确;使用App主要玩游戏的人数为8130,而调查的总人数为56290,≈0.14,故超过10%的大学生使用App主要玩游戏,所以②错误;使用App主要找人聊天的大学生人数为16540,因为>,所以③正确.故选C.
6.(多选题)(2021·青岛调研)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中正确的是(  )
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
答案 ABD
解析 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选ABD.
二、填空题
7.我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
答案 0.98
解析 经停该站高铁列车所有车次的平均正点率的估计值为==0.98.
8.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒.
答案 16.5
解析 设成绩的70%分位数为x,因为=0.55,=0.85,所以x∈[16,17),
所以0.55+(x-16)×=0.70,解得x=16.5(秒).
9.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为s1,s2,s3,则它们的大小关系为________________(用“>”连接).
答案 s1>s2>s3
解析 根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远,表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方差最小,故s1>s2>s3.
三、解答题
10.共享单车入住泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5000份调查问卷,回收到有效问卷3125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
表(一)
使用者年龄段 25岁以下 26岁~35岁 36岁~45岁 45岁以上
人数 20 40 10 10
表(二)
使用频率 0~6次/月 7~14次/月 15~22次/月 23~31次/月
人数 5 10 20 5
表(三)
满意度 非常满意(9~10) 满意(8~9) 一般(7~8) 不满意(6~7)
人数 15 10 10 5
(1)依据上述表格完成下列三个统计图形:
(2)某城区现有常住人口30万,请用样本估计总体的思想,估计年龄在26岁~35岁之间,每月使用共享单车在7~14次的人数.
解 (1)补全三个统计图如图:
(2)由表(1)可知:年龄在26~35岁之间的有40人,占总抽取人数的一半,用样本估计总体的思想可知,
某城区30万人口中年龄在26~35岁之间的约有30×=15(万人);
又年龄在26~35岁之间每月使用共享单车在7~14次之间的有10人,占总抽取人数的,
用样本估计总体的思想可知,城区年龄在26~35岁之间的15万人中每月使用共享单车在7~14次之间的约有15×=(万人),
所以年龄在26~35岁之间,每月使用共享单车在7~14次之间的约有万人.
11.某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
解 (1)如题图所示,用水量在[0.5,2)的频率的和为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.
∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.
(2)当w=3时,该市居民该月的人均水费估计为
(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).
即当w=3时,该市居民该月的人均水费估计为10.5元.
B级 能力提升
12.(多选题)(2021·淄博模拟)区域经济变化影响着人口的流动,下图为过去某连续5年各省、自治区及直辖市(不含港澳台)人口增长统计图.
某连续5年各省、自治区及直辖市(不含港澳台)人口增长统计图
根据图中的信息,下面结论中正确的是(  )
A.广东人口增量最多,天津增幅最高
B.黑龙江无论是增量还是增幅均居末尾
C.天津、北京、重庆和上海四大直辖市增幅均超过5%
D.人口增量超过200万的省、自治区或直辖市共有7个
答案 ABD
解析 对于A,由图知广东5年人口增加超过400万,增量最多,天津增幅达到了19.2%,增幅最高,A正确;对于B,由图易知正确;对于C,上海的人口增幅为4.9%,未超过5%,不正确;对于D,人口增量超过200万的省或直辖市有天津、北京、重庆、广东、河北、湖南和山东,正确.综上,选ABD.
13.若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.
答案 16,18
解析 ∵x1,x2,x3,…,xn的平均数为5,
∴=5,
∴+1
=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
14.(2020·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴=0.05,∴x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,
∴a=≈32,则中位数为32.
(3)①5个年龄组成绩的平均数为1=×(93+96+97+94+90)=94,方差为s=×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为2=×(93+98+94+95+90)=94,方差为s=×[(-1)2+42+02+12+(-4)2]=6.8.
②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).

展开更多......

收起↑

资源预览