资源简介 中小学教育资源及组卷应用平台第四十二讲 用样本估计总体【考纲解读】理解极差,组距,频率,平均数,方差和标准差的定义,掌握求极差,组距,频率,平均数,方差和标准差的基本方法;理解频率分布折线图,总体密度曲线,频率分布直方图和茎叶图的定义,掌握作频率分布折线图,总体密度曲线,频率分布直方图和茎叶图的基本方法,能够运用频率分布折线图,总体密度曲线,频率分布直方图和茎叶图解答相关的数学问题;掌握用样本估计总体的基本方法,能够运用样本指标推断总体的相应指标。【知识精讲】一、用样本的频率分布估计总体的频率分布:1、频率分布直方图:(1)频数,频率的定义:①频数的定义:各组的个体数,称为频数;②频率的定义:各组个体数与样本个体数的比值,称为频率;(2)频率分布表的定义:反映样本频率分布的表格,称为频率分布表;(3)频率分布直方图的定义:反映样本频率分布规律的直方图,称为频率分布直方图;(4)频率分布直方图的特征:①从频率分布直方图可以清楚的看出频率分布的总体趋势;②从频率分布直方图得不出原始数据的内容;③频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距;④频率分布直方图中各矩形面积之和为1,各矩形高的比等于频率之比;⑤频率分布表和频率分布直方图是一组数据频率分布的两种形式,频率分布表的特征是准确,频率分布直方图的特征是直观。频率分布直方图的作法:①求出数据的极差(极差=数据中的最大值-数据中的最小值);②确定组距与组数;③将数据进行分组;④列出频率分布表;⑤作出频率分布直方图。2、频率分布折线图、总体密度曲线:(1)频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点得到的折线,称为频率分布折线图(在具体作图时左边与原点连接,右边延长与X轴相交);(2)总体密度曲线的定义:当样本的容量增加,作图时所分的组数增加,组距缩小得到的频率折线图就越来越接近一条光滑的曲线,这条曲线称为总体密度曲线。3、茎叶图:(1)茎叶图的定义:当数据是两位有效数字时,用中间的数字表示十位数,两边的数字表示个位数而得到的统计图,称为茎叶图;(2)茎叶图的特征:①茎叶图上的数据没有原始数据信息的损失;②茎叶图中的数据可以随时记录,随时添加;③茎叶图只便于表示两位有效数字的数据;④茎叶图只方便记录两组数据。二、用样本的期望值,方差估计总体的期望值,方差:1、基本统计指标概念:(1)样本期望值(也称样本平均数)的定义:样本数据的平均值,称为样本的期望值(或样本的平均数),样本的期望值(或样本的平均数)反映了一组数据的平均水平;(2)样本众数的定义:样本数据中出现次数最多的数,称为样本的众数;(3)样本中位数的定义:样本数据按大小顺序排列后,处于中间位置的数,称为样本的中位数;(4)样本标准差的定义:样本各数与平均数差的平方和的平均数的算术平方根,称为样本的标准差,样本标准差反映了样本数据的离散程度;(5)样本方差的定义:样本标准差的平方,称为样本方差,样本方差反映了样本数据的离散程度;2、基本统计指标的求法:(1)样本期望值(也称样本平均数)的求法:=;(2)样本标准差的求法:s=;(3)样本方差的求法:=;3、用样本的统计指标估计总体的相应指标:(1)用样本期望值(或样本平均数)估计总体期望值(或总体平均数)的基本方法:一般是用样本期望值(或样本平均数)直接代替估计的总体期望值(或总体平均数);(6)用样本方差(或标准差)估计总体方差(或标准差)的基本方法:一般是用样本方差(或样本标准差)直接代替估计的总体方差(或总体标准差)。【探导考点】考点1频率分布直方图及运用:热点①频率分布直方图的作法;热点②频率分布直方图的运用;考点2茎叶图及运用:热点①茎叶图的作法;热点②茎叶图的运用;考点3用样本指标估计总体指标:热点①用样本期望值(或样本平均数)估计总体期望值(或总体平均数);热点②用样本方差(或样本标准差)估计总体方差(或总体标准差)。【典例解析】【典例1】解答下列问题:1、某校随机抽取100名同学矩形“垃圾分类”的问卷测试,测试结果发现这100名同学的得分在[50,100]内,按得分分成[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图,则这100名同学的得分的中位数为( )A 72.5 B 75 C 77.5 D 802、某校从参加高一年级期中考试的学生中随机抽 0.030 y 频率/组距出60名学生,将其物理成绩(均为整数)分成六 0.025段[40,50),[50,60),------[90,100)后得到 0.020如图所示的频率分布直方图,观察图形的信息,回 0.015答下列问题: 0.010(1)求分数在[70,80)内的频率,并补全这个频 0.005率分布直方图; 0 405060708090100 成绩(分)x(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均成绩。『思考问题1』【典例1】是与频率分布直方图相关的问题,解答这类问题需要理解频率分布直方图的定义,掌握频率分布直方图的作法,能够运用频率分布直方图解答相关的数学问题;(2)解答频率分布直方图问题的方法是:①读懂频率分布直方图;②频率分布直方图中的每一个小矩形的面积是样本数据落在该区域的频率;③所有小矩形面积的和为1;(3)作频率分布直方图的基本方法是:①求出原始数据的极差(最大值与最小值的差);②确定组数与组距;③确定各组的起始点与终点;④列出统计数据分布表;⑤画出频率分布直方图;〔练习1〕解答下列问题:1、从某自动包装机包装的食盐中,随机抽取20袋,测得各袋质量分别为(单位:g)492 496 494 495 498 497 501 502 504 496 497 503 506 508 507 492 496 500 501 499,根据频率分布估计总体分布的原理,该自动包装机的袋装质量在497.5—501.5之间的概率约为 ;2、某人在同一条件下射靶50次,其中射中5环或5环以下2次,射中6环3次,射中7环9次,射中8环21次,射中9环11次,射中10环4次。(1)画出样本频率分布直方图;(2)根据样本的频率分布直方图估计该射击者射中7环—9环的概率约是多少?哪种机器的日均产量较高?【典例2】解答下列问题:以下茎叶图记录了甲,乙两组各5名学生 甲组 乙组在一次英语听力测试中的成绩(单位:分), 9 0 9已知甲组数据的中位数为15,乙组数据的平均 x 2 1 5 y 8值为16.8,则x,y的值分别为( ) 7 4 2 4A 2,5 B 5,5 C 5,8 D 8,82、为比较甲,乙两地某月14时的气温情况, 甲地 乙地随机选取该月中的5天,将这5天中14时的 9 8 6 2 8 9气温数据(单位:)制成如图所示的茎叶 1 1 3 0 1 2图,考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温标准差小于乙地该月14时的气温标准差;④甲地该月14时的气温标准差大于乙地该月14时的气温标准差;其中根据茎叶图能得到的统计结论的编号为( )A ①③ B ①④ C ②③ D ②④『思考问题2』【典例2】是与茎叶图相关问题,解答这类问题需要理解茎叶图,的定义,掌握茎叶图的性质和作法;(2)茎叶图的特征是:①茎叶图能够看到真实的数据,没有任何信息损失;②茎叶图便于记录和表示;③茎叶图只便于表示两位有效数字的数据;④茎叶图也只方便记录两组数据;(3)茎叶图的基本画法是:①用两短竖线分成把图分成两部分,②两组数据中选一组放左边,另一组放右边,③把数据的十位数记在两短竖线之间,④将数据的个位数分别记在左右两边;(4)解答茎叶图问题的基本方法是:①读懂茎叶图;②茎叶图表示的是两位有效数字的数据;③茎叶图只能记录(或表示)两组数据。〔练习2〕解答下列问题:1、将某选手的9个得分去掉1个最高分, 8 7 7去掉1个最低分,7个剩余分数的平均分为 9 4 0 1 0 x 9 191分,现场作的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为 ;2、如图是某青年歌手大奖赛上七位评委为甲, 甲 乙乙两名选手打出的分数的茎叶图(其中m为数字 0 7 90----9中的一个),去掉一个最高分和一个最低 5 4 5 5 1 8 4 4 6 4 7分后,甲,乙两名选手得分的平均数分别为, m 9 3,则一定有( )A > B < C = D ,的大小与m的值有关【典例3】解答下列问题:1、甲,乙二人参加某体育项目训练,近期的 第一次第二次第三次第四次第五次五次测试成绩得分情况如表: 甲 10 13 12 14 16(1)分别求出两人得分的平均数与方差; 乙 13 14 12 12 14(2)根据表中数据和(1)的计算结果,对两人的训练成绩作出评价。2、某食品厂为加强质量管理,抽查了某天的罐头80只,得到其质量数据如下(单位:克):342 340 348 346 343 342 346 341 344 348 346 346 340 344 342 344 345 340 344 344 336 348 344 345 332 342 342 340 350 343 347 340344 353 340 340 356 346 345 346 340 339 342 352 342 350 348 344350 336 340 338 345 345 349 336 342 338 343 343 341 347 341 347344 339 347 348 343 347 346 344 343 344 342 343 345 339 350 337通过整理得到如表所示的频率分布表:分组 频数累计 频数 频率 分组 频数累计 频数 频率[332,334) 1 1 0.0125 [344,346) 54 17 0.2125[334,336) 1 0 0 [346,348) 64 10 0.125[336,338) 4 3 0.0375 [348,350) 70 6 0.075[338,340) 9 5 0.075 [350,352) 74 4 0.05[340,342) 21 12 0.15 [352,354) 76 2 0.025[342,344) 37 16 0.2 [354,356] 80 1 0.0125(1)画出样本频率分布直方图;(2)根据样本的频率分布直方图估计,质量不小于350克的罐头约占多少?『思考问题3』(1)【典例3】是用样本估计总体的问题,解答这类问题需要理解样本期望值(或样本平均数),样本标准差和样本方差的定义,掌握用样本估计总体的基本方法;(2)用样本估计总体的基本方法有:①点估计;②区间估计;(3)点估计是直接运用样本指标作为估计的总体指标,常用的样本指标有:①样本期望值(或样本平均数);②样本标准差(或方差) ;常用的总体指标有:①总体期望值(或总体平均数);②总体标准差(或方差) ;(4)区间估计是根据问题要求的可靠程度去确定总体指标取值的区间,其基本方法是:①由问题要求的可靠程度确定抽样平均数的误差;②根据抽样平均误差确定抽样误差的允许范围;③根据抽样误差的允许范围确定总体指标的取值区间。〔练习3〕解答下列问题:(1)从全年级的学生的语文考试成绩中任意抽取20名学生的成绩如下(单位:分)60 90 85 75 65 70 80 90 95 80 85 95 75 70 85 80 85 65 90 85求全年级学生语文考试平均成绩的估计值;(2)甲、乙两台机器同时制造某种零件,抽查15天中这两台机器制造该零件的数量,结果如下:机器甲:151 150 141 143 135 131 141 142 150 142 144 137 134 140 134机器乙:147 146 148 155 157 149 146 148 149 146 148 158 147 147 146哪种机器的日均产量较高?(3)从甲、乙两个总体中各抽取了一个样本:甲 900 920 900 850 910 920乙 890 960 950 850 860 890根据上述样本估计,哪个总体的波动较小;【追踪考试】1、从某小区随机抽取100户居民用户进行月用电量调查,发现他们的月用电量 50—300kw.h之间,适当分组(每组为左闭右开区间)后绘制成如图所示的频率分布直方图,则直方图中x的值以及在被调查的用户约用电量落在区间[100,250)内的户数分布为( )(成都市2020级高三零诊)A 0.0046 ,72 B 0.0046,70 C 0.0042 ,72 D 0.0042 ,70甲 乙2、分别统计了甲,乙两位同学16周的各周 6 1 5课外体育运动时长(单位:h),得到如表所 8 5 3 0 6 3示的茎叶图: 7 5 3 2 7 4 6则下列结论中错误的是( )(2022全国高考 6 4 2 1 8 1 2 2 5 6 6 6 6乙卷文) 4 2 9 0 2 3 8A 甲同学周课外体育运动时长的样本中位数为7.4 10 1 B 乙同学周课外体育运动时长的样本平均数大于8 C 甲同学周课外体育运动时长大于8的概率的估计值大于0.4 D 乙同学周课外体育运动时长大于8的概率的估计值大于0.63、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )(2021全国高考甲卷)A该地农户家庭年收入低于4.5万元的农户比率估计为6%B该地农户家庭年收入不低于10.5万元的农户比率估计为10%C估计该地农户家庭年收入的平均值不超过6.5万元D根据该地有一半以上农户,其家庭年收入介于4.5万元至8.5万元之间4、如图,是某赛季甲,乙两名篮球运动员9场比赛 甲 乙所得分数的茎叶图,则下列说法错误的是( )(20 0 820成都市高三零诊)A 甲所得分数的极差为22 B 7 5 1 1 1 2 6 8乙所得分数的中位数为18 C 两人所得分数的众数相 4 2 2 0 2 0 2 2等D 甲所得分数的平均数低于乙所得分数的平均数 3 2 3 15、如图是某赛季甲,乙两名篮球运动员9场比赛 甲 乙所得分数的茎叶图,则下列说法错误的是( ) 0 8A甲所得分数的极差为22 B乙所得分数的中位数为18 7 5 1 1 1 2 6 8C两人所得分数的众数相等 D 甲所得分数的平均数低于 4 2 2 0 2 0 2 2乙所得分数的平均数(2020成都市高三零诊) 3 2 3 16、某校随机抽取100名同学矩形“垃圾分类”的问卷测试,测试结果发现这100名同学的得分在[50,100]内,按得分分成[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图,则这100名同学的得分的中位数为( )(2020成都市高三一诊)A 72.5 B 75 C 77.5 D 807、如图是某班篮球队队员身高(单位:厘米)的 16 8茎叶图,则该篮球队队员身高的众数是( )(2018 17 2 7 4 9—2019成都市高二上期调研考试) 18 1 6 6 5A 168 B 181 C 186 D 191 19 18、已知数据,,的方差=4,则=2,+2,+2的方差为( )(2018—2019成都市高二上期调研考试)A 4 B 6 C 16 D 36『思考问题4』【典例4】是近几年高考(或高三诊断考试或高二期末考试)试卷中关于用样本估计总体问题的试题,归结起来主要包括:①频率分布直方图及运用;②茎叶图及运用;③用样本指标估计总体指标等几种类型;解答用样本估计总体问题的基本方法是:①根据问题结构特征,判断问题所属类型;②运用解答高类型问题的解题思路和基本方法对问题实施解答;③得出解答问题的结果。〔练习4〕解答下列问题:1、下图是某超市一年中各月的收入与支出(单位:万元)情况的条形统计图,已知利润为收入与支出的差,即利润=收入-支出,则下列说法正确的是( )(2018—2019成都市高二上期调研考试)A 利润最高的月份是2月份,且2月份的利润为40万元 B利润最低的月份是5月份,且5月份的利润为10万元 C 收入最少的月份的利润也最少 D收入最少的月份的支出也最少2、某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的成绩,发现都在[80,150]内,现将这100名学生的成绩按照[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后,得到的频率分布直方图如图所示,则下列说法正确的是( )(2018—2019成都市高二上期调研考试)A 频率分布直方图中a的值为0.040 B 样本数据低于130分的频率为0.3C 总体的中位数(保留1位小数)估计为123.3分D 总体分布在[90,100)的频数一定与总体分布在[100,110)的频数相等3、《西游记》,《三国演义》,《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著,某中学为了解本校学生阅读四大名著的情况,随机调查了100名学生,其中阅读过《西游记》或《红楼梦》的学生共有90名,阅读过《红楼梦》的学生共有80名,阅读过《西游记》且阅读过《红楼梦》的学生共有60名,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )(2019全国高考新课标III)A 0.5 B 0.6 C 0.7 D 0.84、我国的高铁发展迅速,技术先进,经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有,10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 (2019全国高考新课标II)5、某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差=(2019全国高考江苏)6、已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这 8 9 95位裁判打出的分数的平均数为 (2018全国高考江苏卷) 9 0 1 17、从某中学甲班随机抽取9名男同学测量 5 3 5他们的体重(单位:kg),获得体重数据如 6 2 2 4 5茎叶图所示,对这些数据,以下说法正确的 7 1 2 3是( )(2017-2018成都市高二上期质量检测)A 中位数为62 B 中位数为65 C 众数为62 D 众数为648、容量为100的样本,其数据分布在[2,18],将样本数据分为4组[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法不正确的是( )(2017—2018成都市高二上期质量检测)A 样本数据分布在[6,10)的频率为0.32 B 样本数据分布在[10,14)的频数为40C 样本数据分布在[2,10)的频数为40 D 估计总体数据大约有10%分布在[10,14)第四十二讲 用样本估计总体【考纲解读】1.理解极差,组距,频率,平均数,方差和标准差的定义,掌握求极差,组距,频率,平均数,方差和标准差的基本方法;2.理解频率分布折线图,总体密度曲线,频率分布直方图和茎叶图的定义,掌握作频率分布折线图,总体密度曲线,频率分布直方图和茎叶图的基本方法,能够运用频率分布折线图,总体密度曲线,频率分布直方图和茎叶图解答相关的数学问题;3.掌握用样本估计总体的基本方法,能够运用样本指标推断总体的相应指标。【知识精讲】一、用样本的频率分布估计总体的频率分布:1、频率分布直方图:(1)频数,频率的定义:①频数的定义:各组的个体数,称为频数;②频率的定义:各组个体数与样本个体数的比值,称为频率;(2)频率分布表的定义:反映样本频率分布的表格,称为频率分布表;(3)频率分布直方图的定义:反映样本频率分布规律的直方图,称为频率分布直方图;(4)频率分布直方图的特征:①从频率分布直方图可以清楚的看出频率分布的总体趋势;②从频率分布直方图得不出原始数据的内容;③频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距;④频率分布直方图中各矩形面积之和为1,各矩形高的比等于频率之比;⑤频率分布表和频率分布直方图是一组数据频率分布的两种形式,频率分布表的特征是准确,频率分布直方图的特征是直观。频率分布直方图的作法:①求出数据的极差(极差=数据中的最大值-数据中的最小值);②确定组距与组数;③将数据进行分组;④列出频率分布表;⑤作出频率分布直方图。2、频率分布折线图、总体密度曲线:(1)频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点得到的折线,称为频率分布折线图(在具体作图时左边与原点连接,右边延长与X轴相交);(2)总体密度曲线的定义:当样本的容量增加,作图时所分的组数增加,组距缩小得到的频率折线图就越来越接近一条光滑的曲线,这条曲线称为总体密度曲线。3、茎叶图:(1)茎叶图的定义:当数据是两位有效数字时,用中间的数字表示十位数,两边的数字表示个位数而得到的统计图,称为茎叶图;(2)茎叶图的特征:①茎叶图上的数据没有原始数据信息的损失;②茎叶图中的数据可以随时记录,随时添加;③茎叶图只便于表示两位有效数字的数据;④茎叶图只方便记录两组数据。二、用样本的期望值,方差估计总体的期望值,方差:1、基本统计指标概念:(1)样本期望值(也称样本平均数)的定义:样本数据的平均值,称为样本的期望值(或样本的平均数),样本的期望值(或样本的平均数)反映了一组数据的平均水平;(2)样本众数的定义:样本数据中出现次数最多的数,称为样本的众数;(3)样本中位数的定义:样本数据按大小顺序排列后,处于中间位置的数,称为样本的中位数;(4)样本标准差的定义:样本各数与平均数差的平方和的平均数的算术平方根,称为样本的标准差,样本标准差反映了样本数据的离散程度;(5)样本方差的定义:样本标准差的平方,称为样本方差,样本方差反映了样本数据的离散程度;2、基本统计指标的求法:(1)样本期望值(也称样本平均数)的求法:=;(2)样本标准差的求法:s=;(3)样本方差的求法:=;3、用样本的统计指标估计总体的相应指标:(1)用样本期望值(或样本平均数)估计总体期望值(或总体平均数)的基本方法:一般是用样本期望值(或样本平均数)直接代替估计的总体期望值(或总体平均数);(6)用样本方差(或标准差)估计总体方差(或标准差)的基本方法:一般是用样本方差(或样本标准差)直接代替估计的总体方差(或总体标准差)。【探导考点】考点1频率分布直方图及运用:热点①频率分布直方图的作法;热点②频率分布直方图的运用;考点2茎叶图及运用:热点①茎叶图的作法;热点②茎叶图的运用;考点3用样本指标估计总体指标:热点①用样本期望值(或样本平均数)估计总体期望值(或总体平均数);热点②用样本方差(或样本标准差)估计总体方差(或总体标准差)。【典例解析】【典例1】解答下列问题:1、某校随机抽取100名同学矩形“垃圾分类”的问卷测试,测试结果发现这100名同学的得分在[50,100]内,按得分分成[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图,则这100名同学的得分的中位数为( )(2020成都市高三一诊)A 72.5 B 75 C 77.5 D 80【解析】【知识点】①频率分布直方图的定义与性质;②中位数的定义与求法。【解题思路】运用频率分布直方图的性质,中位数的求法,求出这100名同学的得分的中位数就可得出选项。【详细解答】分数在[50,70)的频率=(0.010+0.030)10=0.4<0.5,分数在[50,80)的频率=(0.010+0.030+0.040)10=0.7>0.5,中位数在[70,80)这一组内,设中位数为70+x,0.4+0.040x=0.5,x==2.5, 这100名同学得分的中位数为70+2.5=72.5(分) , A正确,选A。2、某校从参加高一年级期中考试的学生中随机抽 0.030 y 频率/组距出60名学生,将其物理成绩(均为整数)分成六 0.025段[40,50),[50,60),------[90,100)后得到 0.020如图所示的频率分布直方图,观察图形的信息,回 0.015答下列问题: 0.010(1)求分数在[70,80)内的频率,并补全这个频 0.005率分布直方图; 0 405060708090100 成绩(分)x(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均成绩。【解析】【知识点】①频率分布直方图的定义与性质;②频率的定义与求法;③平均数的定义与求法;④统计估计的基本方法。【解题思路】(1)运用频率分布直方图的性质,频率的求法,就可求出分数在[70,80)内的频率;(2)估计组距数列平均数的计算方法求出样本的平均数,利用统计估计的基本方法就可估计本次考试中的平均成绩。【详细解答】(1)1-10 (0.005+0.010+2 0.015+0.025)=1-0.7=0.3,分数在[70,80)内的频率为0.3,补全这个频率分布直方图如图所示;(2)样本分数的平均数为:=10(450.010+550.015+650.015+750.030+850.025+950.005)=66.35(分),估计本次考试中的平均成绩为66.35分。『思考问题1』【典例1】是与频率分布直方图相关的问题,解答这类问题需要理解频率分布直方图的定义,掌握频率分布直方图的作法,能够运用频率分布直方图解答相关的数学问题;(2)解答频率分布直方图问题的方法是:①读懂频率分布直方图;②频率分布直方图中的每一个小矩形的面积是样本数据落在该区域的频率;③所有小矩形面积的和为1;(3)作频率分布直方图的基本方法是:①求出原始数据的极差(最大值与最小值的差);②确定组数与组距;③确定各组的起始点与终点;④列出统计数据分布表;⑤画出频率分布直方图;〔练习1〕解答下列问题:1、从某自动包装机包装的食盐中,随机抽取20袋,测得各袋质量分别为(单位:g)492 496 494 495 498 497 501 502 504 496 497 503 506 508 507 492 496 500 501 499,根据频率分布估计总体分布的原理,该自动包装机的袋装质量在497.5—501.5之间的概率约为 ;(答案:该自动包装机的袋装质量在497.5—501.5之间的概率约为0.25)2、某人在同一条件下射靶50次,其中射中5环或5环以下2次,射中6环3次,射中7环9次,射中8环21次,射中9环11次,射中10环4次。(1)画出样本频率分布直方图;(2)根据样本的频率分布直方图估计该射击者射中7环—9环的概率约是多少?(答案:(1)图略;(2)计该射击者射中7环—9环的概率约是0.82)【典例2】解答下列问题:以下茎叶图记录了甲,乙两组各5名学生 甲组 乙组在一次英语听力测试中的成绩(单位:分), 9 0 9已知甲组数据的中位数为15,乙组数据的平均 x 2 1 5 y 8值为16.8,则x,y的值分别为( ) 7 4 2 4A 2,5 B 5,5 C 5,8 D 8,8【解析】【知识点】①茎叶图的定义与性质;②中位数的定义与求法;③平均数的定义与求法。【解题思路】运用茎叶图的性质,中位数和平均数的求法,得到关于x,y的方程,求解方程求出x,y的值就可得出选项。【详细解答】甲组数据的中位数为15,乙组数据的平均值为16.8,10+x=15,=16.8,即:x=5,y=8,C正确,选C。2、为比较甲,乙两地某月14时的气温情况, 甲地 乙地随机选取该月中的5天,将这5天中14时的 9 8 6 2 8 9气温数据(单位:)制成如图所示的茎叶 1 1 3 0 1 2图,考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温标准差小于乙地该月14时的气温标准差;④甲地该月14时的气温标准差大于乙地该月14时的气温标准差;其中根据茎叶图能得到的统计结论的编号为( )A ①③ B ①④ C ②③ D ②④【解析】【知识点】①茎叶图的定义与性质;②标准差的定义与求法;③平均数的定义与求法。【解题思路】运用茎叶图的性质,标准差和平均数的求法,分别求出甲,乙两地该月14时的平均气温和气温标准差,对各统计结论解析判断就可得出选项。【详细解答】==29,==30,29<30,①正确,②错误;==,==,>,④正确,③错误,B正确,选B。『思考问题2』【典例2】是与茎叶图相关问题,解答这类问题需要理解茎叶图,的定义,掌握茎叶图的性质和作法;(2)茎叶图的特征是:①茎叶图能够看到真实的数据,没有任何信息损失;②茎叶图便于记录和表示;③茎叶图只便于表示两位有效数字的数据;④茎叶图也只方便记录两组数据;(3)茎叶图的基本画法是:①用两短竖线分成把图分成两部分,②两组数据中选一组放左边,另一组放右边,③把数据的十位数记在两短竖线之间,④将数据的个位数分别记在左右两边;(4)解答茎叶图问题的基本方法是:①读懂茎叶图;②茎叶图表示的是两位有效数字的数据;③茎叶图只能记录(或表示)两组数据。〔练习2〕解答下列问题:1、将某选手的9个得分去掉1个最高分, 8 7 7去掉1个最低分,7个剩余分数的平均分为 9 4 0 1 0 x 9 191分,现场作的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为 ;(答案:x表示3,7个剩余分数的方差为)2、如图是某青年歌手大奖赛上七位评委为甲, 甲 乙乙两名选手打出的分数的茎叶图(其中m为数字 0 7 90----9中的一个),去掉一个最高分和一个最低 5 4 5 5 1 8 4 4 6 4 7分后,甲,乙两名选手得分的平均数分别为, m 9 3,则一定有( )(答案:B)A > B < C = D ,的大小与m的值有关【典例3】解答下列问题:1、甲,乙二人参加某体育项目训练,近期的 第一次第二次第三次第四次第五次五次测试成绩得分情况如表: 甲 10 13 12 14 16(1)分别求出两人得分的平均数与方差; 乙 13 14 12 12 14(2)根据表中数据和(1)的计算结果,对两人的训练成绩作出评价。【解析】【知识点】①样本平均数定义与性质;②样本标准差(或方差)定义与求法;③求样本平均数的基本方法;④求样本标准差(或方差)的基本方法。【解题思路】(1)根据样本平均数和方差的性质,运用求样本平均数和样本方差的基本方法,就可求出两人得分的平均数与方差;(2)根据样本标准差的性质,运用求样本标准差的基本方法求出样本的标准差,从而就可对两人的训练成绩作出评价。【详细解答】(1)==13,==13,===4,==;(2)==2,==,2>,甲的训练成绩没有乙的训练成绩稳定。2、某食品厂为加强质量管理,抽查了某天的罐头80只,得到其质量数据如下(单位:克):342 340 348 346 343 342 346 341 344 348 346 346 340 344 342 344 345 340 344 344 336 348 344 345 332 342 342 340 350 343 347 340344 353 340 340 356 346 345 346 340 339 342 352 342 350 348 344350 336 340 338 345 345 349 336 342 338 343 343 341 347 341 347344 339 347 348 343 347 346 344 343 344 342 343 345 339 350 337通过整理得到如表所示的频率分布表:分组 频数累计 频数 频率 分组 频数累计 频数 频率[332,334) 1 1 0.0125 [344,346) 54 17 0.2125[334,336) 1 0 0 [346,348) 64 10 0.125[336,338) 4 3 0.0375 [348,350) 70 6 0.075[338,340) 9 5 0.0625 [350,352) 74 4 0.05[340,342) 21 12 0.15 [352,354) 76 2 0.025[342,344) 37 16 0.2 [354,356] 80 1 0.0125(1)画出样本频率分布直方图;(2)根据样本的频率分布直方图估计,质量不小于350克的罐头约占多少?【解析】【知识点】①频率分布直方图定义与性质;②作频率分布直方图的基本方法;③用样本指标估计总体指标的基本方法。【解题思路】(1)根据频率分布直方图的性质,运用作频率分布直方图的基本方法,结合问题条件就可作出样本的频率分布直方图;(2)根据样本频率分布直方图,运用样本指标估计总体指标的基本方法,就可求出质量不小于350克的罐头约占比例。【详细解答】(1)频率分布表如表所示,作出样本频率分布直方图如图所示;(2)0.05+0.25+0.0125=0.3125,样本中质量不小于350克的罐头约占31.25%,估计这批罐头质量不小于350克的罐头约占31.25%。『思考问题3』(1)【典例3】是用样本估计总体的问题,解答这类问题需要理解样本期望值(或样本平均数),样本标准差和样本方差的定义,掌握用样本估计总体的基本方法;(2)用样本估计总体的基本方法有:①点估计;②区间估计;(3)点估计是直接运用样本指标作为估计的总体指标,常用的样本指标有:①样本期望值(或样本平均数);②样本标准差(或方差) ;常用的总体指标有:①总体期望值(或总体平均数);②总体标准差(或方差) ;(4)区间估计是根据问题要求的可靠程度去确定总体指标取值的区间,其基本方法是:①由问题要求的可靠程度确定抽样平均数的误差;②根据抽样平均误差确定抽样误差的允许范围;③根据抽样误差的允许范围确定总体指标的取值区间。〔练习3〕解答下列问题:1、从全年级的学生的语文考试成绩中任意抽取20名学生的成绩如下(单位:分)60 90 85 75 65 70 80 90 95 80 85 95 75 70 85 80 85 65 90 85求全年级学生语文考试平均成绩的估计值;(答案:全年级学生语文考试平均成绩的估计值为79.75分)2、甲、乙两台机器同时制造某种零件,抽查15天中这两台机器制造该零件的数量,结果如下:机器甲:151 150 141 143 135 131 141 142 150 142 144 137 134 140 134机器乙:147 146 148 155 157 149 146 148 149 146 148 158 147 147 146哪种机器的日均产量较高?(答案:乙机器的日均产量149.2高于甲机器的日均产量141.4)(3)从甲、乙两个总体中各抽取了一个样本:甲 900 920 900 850 910 920乙 890 960 950 850 860 890根据上述样本估计,哪个总体的波动较小;(答案:甲总体的标准差==,<乙总体的标准差==,甲总体的波动较小)【追踪考试】1、从某小区随机抽取100户居民用户进行月用电量调查,发现他们的月用电量 50—300kw.h之间,适当分组(每组为左闭右开区间)后绘制成如图所示的频率分布直方图,则直方图中x的值以及在被调查的用户约用电量落在区间[100,250)内的户数分布为( )(成都市2020级高三零诊)A 0.0046 ,72 B 0.0046,70 C 0.0042 ,72 D 0.0042 ,70【解析】【考点】①频率分布直方图定义与性质;②频率定义与性质;③确定某一区间数据的基本方法。【解答思路】根据频率分布直方图和频率的性质,求出x的值和区间[100,250)的频率,从而求出用电量落在区间[100,250)内的户数,就可得出选项。【详细解答】由频率分布直方图可知,50(0.0024+0.0032+0.0038+x+0.0060)=50(0.0154+x)=1, x=0.02-0.0154=0.0046, 用电量落在区间[100,250)内的频率为50(0.00380.0046+0.0060)=0.72,用电量落在区间[100,250)内的户数为1000.72=72(户),A正确,选A。 甲 乙2、分别统计了甲,乙两位同学16周的各周 6 1 5课外体育运动时长(单位:h),得到如表所 8 5 3 0 6 3示的茎叶图: 7 5 3 2 7 4 6则下列结论中错误的是( )(2022全国高考 6 4 2 1 8 1 2 2 5 6 6 6 6乙卷文) 4 2 9 0 2 3 8A 甲同学周课外体育运动时长的样本中位数为7.4 10 1 B 乙同学周课外体育运动时长的样本平均数大于8 C 甲同学周课外体育运动时长大于8的概率的估计值大于0.4 D 乙同学周课外体育运动时长大于8的概率的估计值大于0.6【解析】【考点】①茎叶图定义与性质;②中位数定义与求法;③平均数定义与求法;④统计估计的基本方法。【解题思路】根据茎叶图的性质,运用求中位数和平均数的基本方法,结合问题条件分别求出甲同学周课外体育运动时长的样本中位数和乙同学周课外体育运动时长的样本平均数,利用统计估计的基本方法,分别估计出甲同学周课外体育运动时长大于8的概率和乙同学周课外体育运动时长大于8的概率就可得出选项。【详细解答】甲同学周课外体育运动时长的样本中位数为=7.4,乙同学周课外体育运动时长的样本平均数为=8.50625>8,甲同学周课外体育运动时长大于8的概率的估计值为=0.375<0.4,乙同学周课外体育运动时长大于8的概率的估计值为=0.8125>0.8,C结论不正确,选C。3、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )(2021全国高考甲卷)A该地农户家庭年收入低于4.5万元的农户比率估计为6%B该地农户家庭年收入不低于10.5万元的农户比率估计为10%C估计该地农户家庭年收入的平均值不超过6.5万元D根据该地有一半以上农户,其家庭年收入介于4.5万元至8.5万元之间【解析】【考点】①频率分布直方图的定义与性质;②频率的定义与基本求法;③统计估计的基本方法;④平均数计算公式及运用。【解题思路】根据样频率分布直方图的性质和求频率的基本方法,结合问题条件分别求出该地农户家庭年收入低于4.5万元的农户,低于10.5万元的农户和介于4.5万元至8.5万元之间的农户的频率,运用计算平均数的公式求出该地农户家庭年收入的平均值,利用统计估计的基本方法就可得出选项。【详细解答】该地农户家庭年收入低于4.5万元的农户比率为(0.02+0.04)1=0.06,A正确;该地农户家庭年收入低于10.5万元的农户比率(0.02+0.04+0.13+0.14+0.202)1=0.90,该地农户家庭年收入不低于10.5万元的农户比率为1-0.90=0.10,即B正确;该地农户家庭年收入的平均值为0.02(3+12+13+14)+0.04(4+11)+0.10(5+9+10)+0.146+0.20(7+8)=7.68>6.5,C错误,C结论不正确,选C。4、如图是某赛季甲,乙两名篮球运动员9场比赛 甲 乙所得分数的茎叶图,则下列说法错误的是( ) 0 8A甲所得分数的极差为22 B乙所得分数的中位数为18 7 5 1 1 1 2 6 8C两人所得分数的众数相等 D 甲所得分数的平均数低于 4 2 2 0 2 0 2 2乙所得分数的平均数(2020成都市高三零诊) 3 2 3 1【解析】【考点】①茎叶图的定义与性质;②极差的定义与求法;③中位数的定义与求法;④众数的定义与求法;⑤平均数的定义与求法。【解题思路】运用茎叶图的性质,结合问题条件分别求出甲所得分数的极差,乙所得分数的中位数,甲,乙所得分数的众数和平均数就可得出选项。【详细解答】甲所得分数的极差为33-11=22,A正确;乙所得分数的中位数为18,B正确;甲,乙所得分数的众数分别为22,22,C正确;甲,乙所得分数的平均数分别为= 21.8,= 17.8,21.8>17.8,>,D错误,选D。5、某校随机抽取100名同学矩形“垃圾分类”的问卷测试,测试结果发现这100名同学的得分在[50,100]内,按得分分成[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图,则这100名同学的得分的中位数为( )(2020成都市高三一诊)A 72.5 B 75 C 77.5 D 80【解析】【考点】①频率的定义与性质;②统计条形图的定义与运用;③中位数的定义及组局数列中位数的基本求法。【解题思路】根据中位数的定义和组距数列中位数的基本求法,先确定中位数所在的组,再运用中位数就是使频率为0.5的数的特征求出中位数。【详细解答】分数在[50,70)的频率=(0.010+0.030)10=0.4<0.5,分数在[50,80)的频率=(0.010+0.030+0.040)10=0.7>0.5,中位数在[70,80)这一组内,设中位数为70+x,0.4+0.040x=0.5,x==2.5, 这100名同学得分的中位数为70+2.5=72.5(分) , A正确,选A。7、如图是某班篮球队队员身高(单位:厘米)的 16 8茎叶图,则该篮球队队员身高的众数是( )(2018 17 2 7 4 9—2019成都市高二上期调研考试) 18 1 6 6 5A 168 B 181 C 186 D 191 19 1【解析】【考点】①茎叶图的定义与性质;②众数的定义与性质;③确定一组数据众数的基本方法。【解题思路】运用茎叶图,根据众数的性质和确定一组数据众数的基本方法得到该篮球队队员身高的众数就可得出选项。【详细解答】186出现了两次,次数最多,该篮球队队员身高的众数是186,C正确,选C。8、已知数据,,的方差=4,则=2,+2,+2的方差为( )(2018—2019成都市高二上期调研考试)A 4 B 6 C 16 D 36【解析】【考点】①方差的定义与性质;②求一组数据方差的基本方法。【解题思路】根据方差的性质,运用求一组数据方差的基本方法,通过运算求出JQ+2,+2,7+2的方差就可得出选项。【详细解答】数据,,的方差=4,数据+2,+2, +2的方差= 4=4,A正确,选A。『思考问题4』【典例4】是近几年高考(或高三诊断考试或高二期末考试)试卷中关于用样本估计总体问题的试题,归结起来主要包括:①频率分布直方图及运用;②茎叶图及运用;③用样本指标估计总体指标等几种类型;解答用样本估计总体问题的基本方法是:①根据问题结构特征,判断问题所属类型;②运用解答高类型问题的解题思路和基本方法对问题实施解答;③得出解答问题的结果。〔练习4〕解答下列问题:1、下图是某超市一年中各月的收入与支出(单位:万元)情况的条形统计图,已知利润为收入与支出的差,即利润=收入-支出,则下列说法正确的是( )(2018—2019成都市高二上期调研考试)(答案:D)A 利润最高的月份是2月份,且2月份的利润为40万元 B利润最低的月份是5月份,且5月份的利润为10万元 C 收入最少的月份的利润也最少 D收入最少的月份的支出也最少2、某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的成绩,发现都在[80,150]内,现将这100名学生的成绩按照[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后,得到的频率分布直方图如图所示,则下列说法正确的是( )(2018—2019成都市高二上期调研考试)(答案:C)A 频率分布直方图中a的值为0.040 B 样本数据低于130分的频率为0.3C 总体的中位数(保留1位小数)估计为123.3分D 总体分布在[90,100)的频数一定与总体分布在[100,110)的频数相等3、《西游记》,《三国演义》,《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著,某中学为了解本校学生阅读四大名著的情况,随机调查了100名学生,其中阅读过《西游记》或《红楼梦》的学生共有90名,阅读过《红楼梦》的学生共有80名,阅读过《西游记》且阅读过《红楼梦》的学生共有60名,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )(2019全国高考新课标III)(答案:C)A 0.5 B 0.6 C 0.7 D 0.84、我国的高铁发展迅速,技术先进,经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有,10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 (2019全国高考新课标II)5、某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差=(2019全国高考江苏)(答案:=)6、已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这 8 9 95位裁判打出的分数的平均数为 (2018全国高考江苏卷)(答案:90) 9 0 1 17、从某中学甲班随机抽取9名男同学测量 5 3 5他们的体重(单位:kg),获得体重数据如 6 2 2 4 5茎叶图所示,对这些数据,以下说法正确的 7 1 2 3是( )(2017-2018成都市高二上期质量检测)(答案:C)A 中位数为62 B 中位数为65 C 众数为62 D 众数为648、容量为100的样本,其数据分布在[2,18],将样本数据分为4组[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法不正确的是( )(2017—2018成都市高二上期质量检测)(答案:B)A 样本数据分布在[6,10)的频率为0.32 B 样本数据分布在[10,14)的频数为40C 样本数据分布在[2,10)的频数为40 D 估计总体数据大约有10%分布在[10,14)HYPERLINK "http://21世纪教育网(www.21cnjy.com)" 21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源预览