资源简介 (共35张PPT)9.2 用样本估计总体9.2.1 总体取值规律的估计1.掌握频率分布表的作法以及频率分布直方图的画法.2.掌握用频率分布直方图估计总体.【课程标准要求】必备知识·归纳落实知识点 频率分布直方图作频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的 .(2)决定组距与组数将数据分组时,一般取 组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.(3)将数据分组差等长(4)列频率分布表高度『知识拓展』常见统计图表的特点与区别扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据,折线图主要用于描述数据随时间的变化趋势.基础自测1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )[A] 总体容量越大,估计越精确[B] 总体容量越小,估计越精确[C] 样本容量越大,估计越精确[D] 样本容量越小,估计越精确C【解析】 由用样本估计总体的性质可知,样本容量越大,估计越精确.故选C.2.一个容量为20的样本数据,分组与频数如下表:分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]频数 2 3 4 5 4 2则样本在[10,50)内的频率为( )[A] 0.5 [B] 0.24[C] 0.6 [D] 0.7D3.(人教A版必修第二册P198练习T2改编)某校为了了解高三学生的身体状况,抽取了100名女生测量其体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重(单位:kg)在[40,45)的人数是( )[A] 10 [B] 2[C] 5 [D] 15A0.3关键能力·素养培优题型一 频率分布直方图的绘制[例1] 一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.05.4 4.6 5.8 5.5 6.0 6.5 5.1 6.55.3 5.9 5.5 5.8 6.2 5.4 5.0 5.06.8 6.0 5.0 5.7 6.0 5.5 6.8 6.06.3 5.5 5.0 6.3 5.2 6.0 7.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.45.7 7.4 6.0 5.4 6.5 6.0 6.8 5.86.3 6.0 6.3 5.6 5.3 6.4 5.7 6.76.2 5.6 6.0 6.7 6.7 6.0 5.6 6.26.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.3 7.0 6.0 6.0 5.9 5.4 6.05.2 6.0 6.3 5.7 6.8 6.1 4.5 5.66.3 6.0 5.8 6.3根据上面的数据列出频数表,绘制出频数直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.【解】 (1)计算最大值与最小值的差为7.4-4.0=3.4.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频数分布表:分组 频数[3.95,4.25) 1[4.25,4.55) 1[4.55,4.85) 2[4.85,5.15) 5[5.15,5.45) 11[5.45,5.75) 15[5.75,6.05) 28[6.05,6.35) 13[6.35,6.65) 11[6.65,6.95) 10[6.95,7.25) 2[7.25,7.55] 1合计 100(5)绘制频数直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.·解题策略·绘制频率分布直方图应注意的问题(1)首先画频率分布表,画表格时数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.[变式训练] 某校高二年级期末统一测试,随机抽取一部分学生的数学成绩(单位:分),分组统计如下表.分组 频数 频率[0,30) 3 0.03[30,60) 3 0.03[60,90) 37 0.37[90,120) m n[120,150] 15 0.15合计 M N(1)求出表中m,n,M,N的值,并根据表中所给数据在给出的坐标系中画出频率分布直方图;(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分及以上的人数.[例2] 从某小学随机抽取100名学生,将他们的身高(单位:cm)数据进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,则抽取的100名学生中,身高在[120,140)的人数为( )[A] 30 [B] 40[C] 45 [D] 50题型二 频率分布直方图的应用D【解析】 由10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030,则身高在[120,140)的频率为10×(0.030+0.020)=0.5,所以身高在[120,140)的人数为100×0.5=50.故选D.·解题策略·(2)根据频率分布直方图(表)求样本数据在某区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘样本容量.[变式训练] (1)为了了解某景区暑假游客年龄情况,某管委会对不同年龄段的游客人数进行了统计,并整理得到如下的频率分布直方图(每组为左闭右开的区间).已知20岁到70岁的游客人数共约200万,则年龄在[50,60)的游客人数约为( )[A] 6万 [B] 60万 [C] 8万 [D] 80万【解析】 (1)由频率分布直方图可知,年龄在[50,60)的游客频率为0.030×10=0.3,则此年龄段的游客人数约为0.3×200=60(万).故选B.B40[例3] 某保险公司推出了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.现对5个险种参保客户进行抽样调查,得出如下的统计图.题型三 折线图、条形图、扇形图及其应用用样本估计总体,以下四个选项错误的是( )[A] 30~41周岁参保人数最多[B] 随着年龄的增长,人均参保费用越来越多[C] 54周岁以下的参保人数约占总参保人数的8%[D] 定期寿险最受参保人青睐C【解析】 由扇形图可知,30~41周岁的参保人数最多,故A正确;由折线图可知,随着年龄的增长,人均参保费用越来越多,故B正确;由扇形图可知,54周岁以下的参保人数约占总参保人数的92%,故C错误;由条形图可知,丁险种参保比例最高,故D正确.故选C.·解题策略·(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.(3)折线图反映数据的变化趋势.[变式训练] 如图所示是根据某市3月1日至3月10日的最低气温(单位: ℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位: ℃)的扇形统计图和条形统计图.【解】 该城市3月1日至3月10日的最低气温(单位: ℃)情况如下表所示:日期 1 2 3 4 5 6 7 8 9 10最低气 温/ ℃ -3 -2 0 -1 1 2 0 -1 2 2其中最低气温为-3 ℃的有1天,占10%;最低气温为-2 ℃的有1天,占10%;最低气温为-1 ℃的有2天,占20%;最低气温为0 ℃的有2天,占20%;最低气温为1 ℃的有1天,占10%;最低气温为2 ℃的有3天,占30%.扇形统计图如图所示.条形统计图如图所示.感谢观看9.2.1 总体取值规律的估计【课程标准要求】 1.掌握频率分布表的作法以及频率分布直方图的画法.2.掌握用频率分布直方图估计总体.知识点 频率分布直方图作频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差.(2)决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.(3)将数据分组(4)列频率分布表各小组的频率=.(5)画频率分布直方图纵轴表示,实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.知识拓展常见统计图表的特点与区别 扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据,折线图主要用于描述数据随时间的变化趋势.基础自测1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )[A] 总体容量越大,估计越精确[B] 总体容量越小,估计越精确[C] 样本容量越大,估计越精确[D] 样本容量越小,估计越精确2.一个容量为20的样本数据,分组与频数如下表:分组 [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70]频数 2 3 4 5 4 2则样本在[10,50)内的频率为( )[A] 0.5 [B] 0.24 [C] 0.6 [D] 0.73.(人教A版必修第二册P198练习T2改编)某校为了了解高三学生的身体状况,抽取了100名女生测量其体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重(单位:kg)在[40,45)的人数是( )[A] 10 [B] 2 [C] 5 [D] 15所以女生中体重在[40,45)的人数为0.1×100=10.故选A.4.在样本的频率分布直方图中,一共有n(n≥4,n∈Z)个小矩形,第4个小矩形的面积等于其余(n-1)个小矩形面积和的,则第4个小矩形对应的频率为 . 则其余(n-1)个小矩形对应的频率和为1-x,所以x=(1-x),解得x=0.3.题型一 频率分布直方图的绘制[例1] 一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.05.4 4.6 5.8 5.5 6.0 6.5 5.1 6.55.3 5.9 5.5 5.8 6.2 5.4 5.0 5.06.8 6.0 5.0 5.7 6.0 5.5 6.8 6.06.3 5.5 5.0 6.3 5.2 6.0 7.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.45.7 7.4 6.0 5.4 6.5 6.0 6.8 5.86.3 6.0 6.3 5.6 5.3 6.4 5.7 6.76.2 5.6 6.0 6.7 6.7 6.0 5.6 6.26.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.3 7.0 6.0 6.0 5.9 5.4 6.05.2 6.0 6.3 5.7 6.8 6.1 4.5 5.66.3 6.0 5.8 6.3根据上面的数据列出频数表,绘制出频数直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.(2)决定组距与组数:若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频数分布表:分组 频数[3.95,4.25) 1[4.25,4.55) 1[4.55,4.85) 2[4.85,5.15) 5续 表分组 频数[5.15,5.45) 11[5.45,5.75) 15[5.75,6.05) 28[6.05,6.35) 13[6.35,6.65) 11[6.65,6.95) 10[6.95,7.25) 2[7.25,7.55] 1合计 100(5)绘制频数直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.绘制频率分布直方图应注意的问题(1)首先画频率分布表,画表格时数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.(2)在绘制出频率分布表后,画频率分布直方图的关键就是确定小长方形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”,然后以各组的所占的比例来定高.[变式训练] 某校高二年级期末统一测试,随机抽取一部分学生的数学成绩(单位:分),分组统计如下表.分组 频数 频率[0,30) 3 0.03[30,60) 3 0.03[60,90) 37 0.37[90,120) m n[120,150] 15 0.15合计 M N(1)求出表中m,n,M,N的值,并根据表中所给数据在给出的坐标系中画出频率分布直方图;(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分及以上的人数.所以m=100-(3+3+37+15)=42,n==0.42,N=0.03+0.03+0.37+0.42+0.15=1,频率分布直方图如图所示.(2)由题意,知全校成绩在90分及以上的学生的人数约为×600=342.题型二 频率分布直方图的应用[例2] 从某小学随机抽取100名学生,将他们的身高(单位:cm)数据进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,则抽取的100名学生中,身高在[120,140)的人数为( )[A] 30 [B] 40 [C] 45 [D] 50(1)由于频率分布直方图中的纵坐标为,因此涉及纵坐标中含参数的问题,应根据频率之和为1列式求解.(2)根据频率分布直方图(表)求样本数据在某区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘样本容量.[变式训练] (1)为了了解某景区暑假游客年龄情况,某管委会对不同年龄段的游客人数进行了统计,并整理得到如下的频率分布直方图(每组为左闭右开的区间).已知20岁到70岁的游客人数共约200万,则年龄在[50,60)的游客人数约为( )[A] 6万 [B] 60万 [C] 8万 [D] 80万(2)在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的,且中间一组的频数为10,则样本容量是 . (2)设中间长方形的面积为x,样本容量为n.由题意得x=(1-x),解得x=,即中间一组的频率为,所以=,解得n=40.题型三 折线图、条形图、扇形图及其应用[例3] 某保险公司推出了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.现对5个险种参保客户进行抽样调查,得出如下的统计图.用样本估计总体,以下四个选项错误的是( )[A] 30~41周岁参保人数最多[B] 随着年龄的增长,人均参保费用越来越多[C] 54周岁以下的参保人数约占总参保人数的8%[D] 定期寿险最受参保人青睐由折线图可知,随着年龄的增长,人均参保费用越来越多,故B正确;由扇形图可知,54周岁以下的参保人数约占总参保人数的92%,故C错误;由条形图可知,丁险种参保比例最高,故D正确.故选C.(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.(3)折线图反映数据的变化趋势.[变式训练] 如图所示是根据某市3月1日至3月10日的最低气温(单位: ℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位: ℃)的扇形统计图和条形统计图.日期 1 2 3 4 5 6 7 8 9 10最低气 温/ ℃ -3 -2 0 -1 1 2 0 -1 2 2其中最低气温为-3 ℃的有1天,占10%;最低气温为-2 ℃的有1天,占10%;最低气温为-1 ℃的有2天,占20%;最低气温为0 ℃的有2天,占20%;最低气温为1 ℃的有1天,占10%;最低气温为2 ℃的有3天,占30%.扇形统计图如图所示.条形统计图如图所示.(分值:70分) 单选每题5分,多选每题6分.1.关于频率分布直方图中的有关数据,下列说法正确的是( )[A] 小长方形的高表示该组内的个体在样本中出现的频率与组距的比值[B] 小长方形的高表示该组内的个体在样本中出现的频率[C] 小长方形的高表示取某数的频率[D] 小长方形的高表示该组内的个体数与组距的比值2.容量为100的样本数据被分为6组,如下表所示,则第3组的频率是( )组号 1 2 3 4 5 6频数 14 17 x 20 16 15[A] 0.15 [B] 0.16 [C] 0.18 [D] 0.203.某校高一组建了演讲、舞蹈、合唱、绘画、英语协会五个兴趣小组,高一1 500名学生每人都参加且只参加其中一个兴趣小组,学校从这1 500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:则选取的学生中,参加舞蹈兴趣小组的学生数为( )[A] 20 [B] 30 [C] 35 [D] 40因此选取的总人数为=200,由扇形图得演讲及舞蹈人数和占比为1-20%-10%-35%=35%,人数和为200×35%=70,由条形图得演讲人数为30,所以舞蹈兴趣小组人数为40.故选D.4.如图是甲、乙两人高考前10次数学模拟成绩的折线图,则下列说法正确的是( )[A] 甲的数学成绩最后3次逐渐降低[B] 甲的数学成绩在130分及以上的次数少于乙的数学成绩在130分及以上的次数[C] 甲有7次考试成绩比乙高[D] 甲数学成绩的极差大于乙数学成绩的极差对于B,甲的数学成绩在130分及以上的次数为6次,乙的数学成绩在130分及以上的次数为5次,故B说法错误;对于C,甲有7次考试成绩比乙高,故C说法正确;对于D,由折线图可知,甲乙两人的数学成绩的最高成绩差不多,甲的最低成绩为120分,乙的最低成绩为110分,因此甲数学成绩的极差小于乙数学成绩的极差,D说法错误.故选C.5.(多选题)某学校为了提高高三年级学生的某学科成绩,在第一次联考后采取了“培优补短”等一系列举措.为了更好地总结经验,现从高三年级1 000名学生中随机抽取100名学生,将其前后两次联考成绩(满分150分)分别按照[50,70),[70,90),…,[130,150]分成五组,绘制成频率分布直方图,如图所示.下列说法正确的是( )[A] m=0.02[B] 估计该年级第二次联考成绩在130分及以上的学生比第一次联考对应分数段的多10人[C] 第二次联考学生的成绩波动更小[D] 与第一次联考相比,第二次联考成绩在[50,90)内的学生人数减少,在[110,150]内的学生人数增加130分及以上的学生人数大约占5%,第二次联考成绩在130分及以上的学生人数大约占6%,所以增加1%,则增加的学生人数为10,B正确.第一次联考成绩集中于70~110分的学生人数占比为75%,第二次联考成绩集中于90~130分的学生人数占比为84%,第二次联考成绩数据更集中,所以方差更小,C正确.第一次联考成绩在[50,90)内的学生人数占比为35%,在[110,150]内的学生人数占比为20%,第二次联考成绩在[50,90)内的学生人数占比为10%,在[110,150]内的学生人数占比为46%,D正确.故选BCD.6.(5分)某校抽取100名学生测身高,其中身高最大值为186 cm,最小值为154 cm,根据身高数据绘制频率分布直方图,组距为5,且第一组下限为153.5,则组数为 . 7.(17分)某校为调查高一学生体能训练状况,现抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)求第二小组的频率.(2)求样本容量.(3)若一分钟跳绳次数在110以上为达标,试估计全体高一学生的达标率为多少.则2f+4f+17f+15f+9f+3f=1,解得f=,所以第二小组的频率为4×=.(2)设样本容量为n,则=,所以n=150.(3)由(1)和频率分布直方图可知,次数在110以上的频率为17f+15f+9f+3f=44f=44×=0.88.由此估计全体高一学生的达标率为88%.8.(5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的扇形图.下面的结论:①新农村建设后,种植收入减少;②新农村建设后,其他收入增加了一倍以上;③新农村建设后,养殖收入增加了一倍;④新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半.其中错误的是 . 9.(17分)为调查某小区居民的户外活动情况,现抽取一个容量为100的样本,统计了这些居民一周内的户外活动时长(单位:min),并绘制了如下图所示的频率分布直方图,记数据分布在[50,100),[100,150),[150,200),[200,250),[250,300),[300,350),[350,400]的频率分别为f1,f2,…,f7.已知f1+f2+f3=0.5,f4=2f6.(1)求f2,f6的值;(2)求样本中在[150,300)内的频数;(3)若该小区共2 000名居民,请根据样本数据估计:全小区居民一周内的户外活动时长不少于250 min的人数.又f1+f2+f3=0.5,f4=2f6且f1+f2+f3+f4+f5+f6+f7=1,f2=f5,解得f2=0.15,f6=0.1,f4=0.2.(2)因为f3+f4+f5=0.3+0.2+0.15=0.65,所以样本中在[150,300)内的频数为100×0.65=65.(3)因为f5+f6+f7=0.15+0.1+0.05=0.3,所以根据样本数据估计全小区居民一周内的户外活动时长不少于250 min的人数约为2 000×0.3=600(人).9.2.1 总体取值规律的估计【课程标准要求】 1.掌握频率分布表的作法以及频率分布直方图的画法.2.掌握用频率分布直方图估计总体.知识点 频率分布直方图作频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差.(2)决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.(3)将数据分组(4)列频率分布表各小组的频率=.(5)画频率分布直方图纵轴表示,实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.知识拓展常见统计图表的特点与区别 扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据,折线图主要用于描述数据随时间的变化趋势.基础自测1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )[A] 总体容量越大,估计越精确[B] 总体容量越小,估计越精确[C] 样本容量越大,估计越精确[D] 样本容量越小,估计越精确【答案】 C【解析】 由用样本估计总体的性质可知,样本容量越大,估计越精确.故选C.2.一个容量为20的样本数据,分组与频数如下表:分组 [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70]频数 2 3 4 5 4 2则样本在[10,50)内的频率为( )[A] 0.5 [B] 0.24 [C] 0.6 [D] 0.7【答案】 D【解析】 因为样本在[10,50)内的频数为2+3+4+5=14,样本容量为20,所以在[10,50)内的频率为=0.7.故选D.3.(人教A版必修第二册P198练习T2改编)某校为了了解高三学生的身体状况,抽取了100名女生测量其体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重(单位:kg)在[40,45)的人数是( )[A] 10 [B] 2 [C] 5 [D] 15【答案】 A【解析】 由题图及频率=×组距,知体重在[40,45)的女生的频率=0.02×5=0.1.所以女生中体重在[40,45)的人数为0.1×100=10.故选A.4.在样本的频率分布直方图中,一共有n(n≥4,n∈Z)个小矩形,第4个小矩形的面积等于其余(n-1)个小矩形面积和的,则第4个小矩形对应的频率为 . 【答案】 0.3【解析】 设第4个小矩形对应的频率为x,则其余(n-1)个小矩形对应的频率和为1-x,所以x=(1-x),解得x=0.3.题型一 频率分布直方图的绘制[例1] 一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.05.4 4.6 5.8 5.5 6.0 6.5 5.1 6.55.3 5.9 5.5 5.8 6.2 5.4 5.0 5.06.8 6.0 5.0 5.7 6.0 5.5 6.8 6.06.3 5.5 5.0 6.3 5.2 6.0 7.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.45.7 7.4 6.0 5.4 6.5 6.0 6.8 5.86.3 6.0 6.3 5.6 5.3 6.4 5.7 6.76.2 5.6 6.0 6.7 6.7 6.0 5.6 6.26.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.3 7.0 6.0 6.0 5.9 5.4 6.05.2 6.0 6.3 5.7 6.8 6.1 4.5 5.66.3 6.0 5.8 6.3根据上面的数据列出频数表,绘制出频数直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.【解】 (1)计算最大值与最小值的差为7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频数分布表:分组 频数[3.95,4.25) 1[4.25,4.55) 1[4.55,4.85) 2[4.85,5.15) 5续 表分组 频数[5.15,5.45) 11[5.45,5.75) 15[5.75,6.05) 28[6.05,6.35) 13[6.35,6.65) 11[6.65,6.95) 10[6.95,7.25) 2[7.25,7.55] 1合计 100(5)绘制频数直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.绘制频率分布直方图应注意的问题(1)首先画频率分布表,画表格时数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.(2)在绘制出频率分布表后,画频率分布直方图的关键就是确定小长方形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”,然后以各组的所占的比例来定高.[变式训练] 某校高二年级期末统一测试,随机抽取一部分学生的数学成绩(单位:分),分组统计如下表.分组 频数 频率[0,30) 3 0.03[30,60) 3 0.03[60,90) 37 0.37[90,120) m n[120,150] 15 0.15合计 M N(1)求出表中m,n,M,N的值,并根据表中所给数据在给出的坐标系中画出频率分布直方图;(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分及以上的人数.【解】 (1)由频率分布表得M==100,所以m=100-(3+3+37+15)=42,n==0.42,N=0.03+0.03+0.37+0.42+0.15=1,频率分布直方图如图所示.(2)由题意,知全校成绩在90分及以上的学生的人数约为×600=342.题型二 频率分布直方图的应用[例2] 从某小学随机抽取100名学生,将他们的身高(单位:cm)数据进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,则抽取的100名学生中,身高在[120,140)的人数为( )[A] 30 [B] 40 [C] 45 [D] 50【答案】 D【解析】 由10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030,则身高在[120,140)的频率为10×(0.030+0.020)=0.5,所以身高在[120,140)的人数为100×0.5=50.故选D.(1)由于频率分布直方图中的纵坐标为,因此涉及纵坐标中含参数的问题,应根据频率之和为1列式求解.(2)根据频率分布直方图(表)求样本数据在某区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘样本容量.[变式训练] (1)为了了解某景区暑假游客年龄情况,某管委会对不同年龄段的游客人数进行了统计,并整理得到如下的频率分布直方图(每组为左闭右开的区间).已知20岁到70岁的游客人数共约200万,则年龄在[50,60)的游客人数约为( )[A] 6万 [B] 60万 [C] 8万 [D] 80万(2)在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的,且中间一组的频数为10,则样本容量是 . 【答案】 (1)B (2)40【解析】 (1)由频率分布直方图可知,年龄在[50,60)的游客频率为0.030×10=0.3,则此年龄段的游客人数约为0.3×200=60(万).故选B.(2)设中间长方形的面积为x,样本容量为n.由题意得x=(1-x),解得x=,即中间一组的频率为,所以=,解得n=40.题型三 折线图、条形图、扇形图及其应用[例3] 某保险公司推出了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.现对5个险种参保客户进行抽样调查,得出如下的统计图.用样本估计总体,以下四个选项错误的是( )[A] 30~41周岁参保人数最多[B] 随着年龄的增长,人均参保费用越来越多[C] 54周岁以下的参保人数约占总参保人数的8%[D] 定期寿险最受参保人青睐【答案】 C【解析】 由扇形图可知,30~41周岁的参保人数最多,故A正确;由折线图可知,随着年龄的增长,人均参保费用越来越多,故B正确;由扇形图可知,54周岁以下的参保人数约占总参保人数的92%,故C错误;由条形图可知,丁险种参保比例最高,故D正确.故选C.(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.(3)折线图反映数据的变化趋势.[变式训练] 如图所示是根据某市3月1日至3月10日的最低气温(单位: ℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位: ℃)的扇形统计图和条形统计图.【解】 该城市3月1日至3月10日的最低气温(单位: ℃)情况如下表所示:日期 1 2 3 4 5 6 7 8 9 10最低气 温/ ℃ -3 -2 0 -1 1 2 0 -1 2 2其中最低气温为-3 ℃的有1天,占10%;最低气温为-2 ℃的有1天,占10%;最低气温为-1 ℃的有2天,占20%;最低气温为0 ℃的有2天,占20%;最低气温为1 ℃的有1天,占10%;最低气温为2 ℃的有3天,占30%.扇形统计图如图所示.条形统计图如图所示.(分值:70分) 单选每题5分,多选每题6分.1.关于频率分布直方图中的有关数据,下列说法正确的是( )[A] 小长方形的高表示该组内的个体在样本中出现的频率与组距的比值[B] 小长方形的高表示该组内的个体在样本中出现的频率[C] 小长方形的高表示取某数的频率[D] 小长方形的高表示该组内的个体数与组距的比值【答案】 A【解析】 小长方形的高表示频率与组距的比值,直方图的面积为频率.故选A.2.容量为100的样本数据被分为6组,如下表所示,则第3组的频率是( )组号 1 2 3 4 5 6频数 14 17 x 20 16 15[A] 0.15 [B] 0.16 [C] 0.18 [D] 0.20【答案】 C【解析】 由题表可得第3组的频数为x=100-14-17-20-16-15=18,所以第3组的频率为=0.18.故选C.3.某校高一组建了演讲、舞蹈、合唱、绘画、英语协会五个兴趣小组,高一1 500名学生每人都参加且只参加其中一个兴趣小组,学校从这1 500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:则选取的学生中,参加舞蹈兴趣小组的学生数为( )[A] 20 [B] 30 [C] 35 [D] 40【答案】 D【解析】 由条形图得合唱人数为70,由扇形图得合唱人数占比35%,因此选取的总人数为=200,由扇形图得演讲及舞蹈人数和占比为1-20%-10%-35%=35%,人数和为200×35%=70,由条形图得演讲人数为30,所以舞蹈兴趣小组人数为40.故选D.4.如图是甲、乙两人高考前10次数学模拟成绩的折线图,则下列说法正确的是( )[A] 甲的数学成绩最后3次逐渐降低[B] 甲的数学成绩在130分及以上的次数少于乙的数学成绩在130分及以上的次数[C] 甲有7次考试成绩比乙高[D] 甲数学成绩的极差大于乙数学成绩的极差【答案】 C【解析】 对于A,由折线图可知甲最后三次数学成绩逐渐升高,故A说法错误;对于B,甲的数学成绩在130分及以上的次数为6次,乙的数学成绩在130分及以上的次数为5次,故B说法错误;对于C,甲有7次考试成绩比乙高,故C说法正确;对于D,由折线图可知,甲乙两人的数学成绩的最高成绩差不多,甲的最低成绩为120分,乙的最低成绩为110分,因此甲数学成绩的极差小于乙数学成绩的极差,D说法错误.故选C.5.(多选题)某学校为了提高高三年级学生的某学科成绩,在第一次联考后采取了“培优补短”等一系列举措.为了更好地总结经验,现从高三年级1 000名学生中随机抽取100名学生,将其前后两次联考成绩(满分150分)分别按照[50,70),[70,90),…,[130,150]分成五组,绘制成频率分布直方图,如图所示.下列说法正确的是( )[A] m=0.02[B] 估计该年级第二次联考成绩在130分及以上的学生比第一次联考对应分数段的多10人[C] 第二次联考学生的成绩波动更小[D] 与第一次联考相比,第二次联考成绩在[50,90)内的学生人数减少,在[110,150]内的学生人数增加【答案】 BCD【解析】 因为20m+0.3+0.15+0.05+0.05=1,所以m=0.022 5,A错误.因为第一次联考成绩在130分及以上的学生人数大约占5%,第二次联考成绩在130分及以上的学生人数大约占6%,所以增加1%,则增加的学生人数为10,B正确.第一次联考成绩集中于70~110分的学生人数占比为75%,第二次联考成绩集中于90~130分的学生人数占比为84%,第二次联考成绩数据更集中,所以方差更小,C正确.第一次联考成绩在[50,90)内的学生人数占比为35%,在[110,150]内的学生人数占比为20%,第二次联考成绩在[50,90)内的学生人数占比为10%,在[110,150]内的学生人数占比为46%,D正确.故选BCD.6.(5分)某校抽取100名学生测身高,其中身高最大值为186 cm,最小值为154 cm,根据身高数据绘制频率分布直方图,组距为5,且第一组下限为153.5,则组数为 . 【答案】 7【解析】 第一组[153.5,158.5);第二组[158.5,163.5);第三组[163.5,168.5);第四组[168.5,173.5);第五组[173.5,178.5);第六组[178.5,183.5);第七组[183.5,188.5],所以组数为7.7.(17分)某校为调查高一学生体能训练状况,现抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)求第二小组的频率.(2)求样本容量.(3)若一分钟跳绳次数在110以上为达标,试估计全体高一学生的达标率为多少.【解】 (1)由于每个小长方形的面积即为本组的频率,设第二小组的频率为4f,则2f+4f+17f+15f+9f+3f=1,解得f=,所以第二小组的频率为4×=.(2)设样本容量为n,则=,所以n=150.(3)由(1)和频率分布直方图可知,次数在110以上的频率为17f+15f+9f+3f=44f=44×=0.88.由此估计全体高一学生的达标率为88%.8.(5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的扇形图.下面的结论:①新农村建设后,种植收入减少;②新农村建设后,其他收入增加了一倍以上;③新农村建设后,养殖收入增加了一倍;④新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半.其中错误的是 . 【答案】 ①【解析】 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由扇形图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a,新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.9.(17分)为调查某小区居民的户外活动情况,现抽取一个容量为100的样本,统计了这些居民一周内的户外活动时长(单位:min),并绘制了如下图所示的频率分布直方图,记数据分布在[50,100),[100,150),[150,200),[200,250),[250,300),[300,350),[350,400]的频率分别为f1,f2,…,f7.已知f1+f2+f3=0.5,f4=2f6.(1)求f2,f6的值;(2)求样本中在[150,300)内的频数;(3)若该小区共2 000名居民,请根据样本数据估计:全小区居民一周内的户外活动时长不少于250 min的人数.【解】 (1)依题意f1=f7=0.001×50=0.05,f3=0.006×50=0.3,又f1+f2+f3=0.5,f4=2f6且f1+f2+f3+f4+f5+f6+f7=1,f2=f5,解得f2=0.15,f6=0.1,f4=0.2.(2)因为f3+f4+f5=0.3+0.2+0.15=0.65,所以样本中在[150,300)内的频数为100×0.65=65.(3)因为f5+f6+f7=0.15+0.1+0.05=0.3,所以根据样本数据估计全小区居民一周内的户外活动时长不少于250 min的人数约为2 000×0.3=600(人). 展开更多...... 收起↑ 资源列表 第九章 9.2 9.2.1 总体取值规律的估计 - 学生版.docx 第九章 9.2 9.2.1 总体取值规律的估计.docx 第九章 9.2 9.2.1 总体取值规律的估计.pptx