2023届高考数学一轮复习(全国版)——第70课用样本估计总体学案

资源下载
  1. 二一教育资源

2023届高考数学一轮复习(全国版)——第70课用样本估计总体学案

资源简介

第70课 用样本估计总体
一、目标导引:
1.从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表);
二、知识梳理:
在统计中,为了考查一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类,一类是用样本频率分布估计总体分布,另一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征.
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图的优点
茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.
[提醒] 茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.
4.样本的数字特征
数字特征 概念 优点与缺点
众数 一组数据中重复出现次数最多的数 众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征
中位数 把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数 如果有个数据,那么这个数的平均数 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
标准差 样本数据到平均数的一种平均距离,一般用表示
方差 标准差的平方
三、问题研讨
问题1(样本的数字特征)
例题1:某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:,,.其中a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败.
①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;
②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
【提炼】 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.
2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.
问题2(茎叶图及其应用)
例题2:某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
甲部门 乙部门
3 59
4 4 0448
97 5 122456677789
97665332110 6 011234688
98877766555554443332100 7 00113449
6655200 8 123345
632220 9 011456
10 000
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
【提炼】 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.
2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.
(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.
问题3(频率分布直方图、用样本估计总体)
例题3:我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
【提炼】 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.
2.(1)例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.
问题4(频率分布直方图与分布列相结合)
例题4:某协会对两家服务机构进行满意度调查,在两家服务机构提供过服务的市民中随机抽取了1000人,每人分别对这两家服务机构进行评分,满分均为60分.整理评分数据,将分数以 10 为组距分成6 组: ,得到服务机构分数的频数分布表, 服务机构分数的频率分布直方图:
定义市民对服务机构评价的“满意度指数”如下:
分数
满意度指数
(1)在抽样的1000人中,求对服务机构评价“满意度指数”为0的人数;
(2)从在两家服务机构都提供过服务的市民中随机抽取1人进行调查,试估计其对服务机构评价的“满意度指数”比对服务机构评价的“满意度指数”高的概率;
(3)如果从服务机构中选择一家服务机构,你会选择哪一家?说明理由
四、总结提升
1.在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.
2.在频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.对于开放性问题的回答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论.解决该类问题时,应正确理解图表中各量的意义,通过图表掌握信息是解决该类问题的关键.频率分布指的是样本数据在各个范围内所占的比例的大小,一般用频率分布直方图反映样本的频率分布.
3.用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
4.即数据,,,的均值为,方差为,则
(1)数据,,,的均值为,方差为;
(2)数据,,,的均值为,方差为;
(3)数据,,,的均值为,方差为.
五、即时检测
1.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的序号为(  )
A.①③ B.①④ C.②③ D.②④
2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图9 3 6所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.56 B.60 C.120 D.140
第70课 用样本估计总体
一、目标导引:
1.从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表);
1.解答:抽取产品的质量指标值的样本平均数和样本方差分别为

二、知识梳理:
在统计中,为了考查一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类,一类是用样本频率分布估计总体分布,另一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征.
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图的优点
茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.
[提醒] 茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.
5.样本的数字特征
数字特征 概念 优点与缺点
众数 一组数据中重复出现次数最多的数 众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征
中位数 把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数 如果有个数据,那么这个数的平均数 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
标准差 样本数据到平均数的一种平均距离,一般用表示
方差 标准差的平方
三、问题研讨
问题1(样本的数字特征)
例题1:某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:,,.其中a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败.
①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;
②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
解答:①甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,
其平均数为,方差.
乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,
其平均数为,方差.
因为,,所以甲组的研发水平优于乙组.
②记E={恰有一组研发成功}.
在所抽得的15个结果中,恰有一组研发成功的结果是,共7个.
因此事件E发生的概率为.
用频率估计概率,即得所求概率为P(E)=.
【提炼】 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.
2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.
问题2(茎叶图及其应用)
例题2:某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
甲部门 乙部门
3 59
4 4 0448
97 5 122456677789
97665332110 6 011234688
98877766555554443332100 7 00113449
6655200 8 123345
632220 9 011456
10 000
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
解答:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.
【提炼】 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.
2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.
(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.
问题3(频率分布直方图、用样本估计总体)
例题3:我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解答:(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,
解得a=0.30. 5分
(2)由(1),知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.
所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
【提炼】 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.
2.(1)例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.
问题4(频率分布直方图与分布列相结合)
例题4:某协会对两家服务机构进行满意度调查,在两家服务机构提供过服务的市民中随机抽取了1000人,每人分别对这两家服务机构进行评分,满分均为60分.整理评分数据,将分数以 10 为组距分成6 组: ,得到服务机构分数的频数分布表, 服务机构分数的频率分布直方图:
定义市民对服务机构评价的“满意度指数”如下:
分数
满意度指数
(1)在抽样的1000人中,求对服务机构评价“满意度指数”为0的人数;
(2)从在两家服务机构都提供过服务的市民中随机抽取1人进行调查,试估计其对服务机构评价的“满意度指数”比对服务机构评价的“满意度指数”高的概率;
(3)如果从服务机构中选择一家服务机构,你会选择哪一家?说明理由
解答:(1)由对服务机构的频率分布直方图,得
对服务机构“满意度指数”为0的频率为,
所以,对服务机构评价“满意度指数”为0的人数为人.
(2)设“对服务机构评价‘满意度指数’比对服务机构评价‘满意度指数’高”为事件.记“对服务机构评价‘满意度指数’为1”为事件;“对服务机构评价‘满意度指数’为2”为事件;“对服务机构评价‘满意度指数’为0”为事件;“对服务机构评价‘满意度指数’为1”为事件.
所以,,由用频率估计概率得:
,,因为事件与相互独立,其中,.
所以,所以该学生对服务机构评价的“满意度指数”比对服务机构评价的“满意度指数”高的概率为0.3.
(3)如果从学生对两服务机构评价的“满意度指数”的期望角度看:
服务机构“满意度指数”的分布列为:
服务机构“满意度指数”的分布列为:
因为; ,
所以,会选择服务机构.
四、总结提升
1.在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.
2.在频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.对于开放性问题的回答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论.解决该类问题时,应正确理解图表中各量的意义,通过图表掌握信息是解决该类问题的关键.频率分布指的是样本数据在各个范围内所占的比例的大小,一般用频率分布直方图反映样本的频率分布.
3.用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
4.即数据,,,的均值为,方差为,则
(1)数据,,,的均值为,方差为;
(2)数据,,,的均值为,方差为;
(3)数据,,,的均值为,方差为.
五、即时检测
1.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的序号为(  )
A.①③ B.①④ C.②③ D.②④
解答:甲地5天的气温为:26,28,29,31,31,
其平均数为甲==29;
方差为s=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;
标准差为s甲=.
乙地5天的气温为:28,29,30,31,32,
其平均数为乙==30;
方差为s=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为s乙=.∴甲<乙,s甲>s乙.
故选B
2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图9 3 6所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.56 B.60 C.120 D.140
解答:由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.

展开更多......

收起↑

资源预览