资源简介 (共41张PPT)第九章9.2 用样本估计总体统 计第1课时 总体取值规律的估计学习 目标 1.结合实例,能用样本估计总体的取值规律,掌握频率分布表的作法以及频率分布直方图的画法;2.能根据频率分布表和频率分布直方图观测数据的分布规律,能求解有关频率分布直方图的问题.新知初探·基础落实问题1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.(1) 如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?每户居民月均用水量标准如果定得太低,会影响很多居民的日常生活;如果标准太高,则不利于节水.为了确定一个合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.(2) 你认为为了较为合理地确定出这个标准,需要做哪些工作?由于城市住户较多,全面普查存在时间和经费问题,没有必要,所以通常采用抽样调查的方式,从样本中获取信息,来估计总体的一些性质和特点.通过分析样本数据来估计全市居民用水量的分布情况.一、 概念生成问题2:通过课本P193—194“问题1”中的数据,你能看出哪些信息?如果将这组数据按从小到大排序,发现这组数据的最小值是1.3 t,最大值是28.0 t,其他在1.3 t和28.0 t之间.问题3:为了更深入地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析.在实际问题中,我们更关心什么问题?月均用水量在不同范围内的居民用户占全市居民用户的比例.我们今天来学习频率分布表和频率分布直方图对样本数据进行整理.如何画频率分布表和频率分布直方图?1.求极差极差为一组数据中最大值与最小值的差.样本观测数据的最小值是1.3 t,最大值是28.0 t,极差为28.0-1.3=26.7,这说明样本观测数据的变化范围是26.7 t.2.决定组距与组数合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.数据分组可以是等距的,也可以是不等距的,要根据数据的特点而定.有时为了方便,往往按等距分组,或者除了第一和最后的两段,其他各段按等距分组.分组时可以先确定组距,也可以先确定组数.如果我们取所有组距为3,则==8.9,即可以将数据分为9组,这也说明这个组距是比较合适的.3.将数据分组由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.例如,可以取区间为[1.2,28.2],按如下方式把样本观测数据以组距3分为9组:[1.2,4.2),[4.2,7.2),…,[25.2,28.2].4.列频率分布表计算各小组的频率,例如第一小组的频率是==0.23,作出频率分布表.分组 频数累计 频数 频率[1.2,4.2) 正正正正 . 23 0.23[4.2,7.2) 正正正正正正 . 32 0.32[7.2,10.2) 正正 . 13 0.13[10.2,13.2) 正 . 9 0.09[13.2,16.2) 正 . 9 0.09[16.2,19.2) 正 . 5 0.05[19.2,22.2) 3 0.03[22.2,25.2) 4 0.04[25.2,28.2] 2 0.02合计 100 1.005.画频率分布直方图根据上表可以得到如图所示的频率分布直方图.请同学阅读课本P193—P198,完成下列填空.二、 概念表述1.频率分布直方图(1) 列出样本数据的频率分布表和频率分布直方图的步骤:①求极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且组距=________;③将数据分组:通常对组内数值取左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小组的频数,除以样本容量,得到各小组的频率.⑤画频率分布直方图:以数据的值为横坐标,以______的值为纵坐标绘制直方图.(2) 频率分布直方图的特点:①小长方形的面积=组距×=频率;②各小长方形的面积和等于1;③小长方形的高=,所有小长方形的高的和=.2.根据频率分布直方图求平均数、中位数和众数(1) 平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3) 众数:众数是最高小矩形底边的中点所对应的数据.三、 概念辨析(判断正误:正确的画“√”,错误的画“×”)(1) 样本容量越大,用样本的频率分布去估计总体的频率分布就越准确. ( )(2) 频率分布直方图的横轴表示样本数据,纵轴表示频率. ( )(3) 频率分布直方图中各个小长方形的面积之和等于1. ( )(4) 频率分布直方图中小矩形的面积表示该组的个体数. ( )√×√×典例精讲·能力初成探究1频数与频率 某市共有5 000名高三学生参加联考,为了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成频率分布表如右:根据上面的频率分布表,可知①处的数值为_____,②处的数值为________.1【解析】 设样本容量为n,由位于[110,120)的频数为36,频率为=0.300,得样本容量n=120,所以位于[130,140)的频率为=0.100.②处的数值为1-0.050-0.200-0.300-0.275-0.100-0.050=0.025,①处的数值为0.025×120=3.分组/分 频数 频率[80,90) ① ②[90,100) 0.050[100,110) 0.200[110,120) 36 0.300[120,130) 0.275[130,140) 12 [140,150] 0.050合计 30.025对于频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清楚已知和所求,选择合适的公式解题.变式 容量为100的某个样本,数据拆分为10组,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组的频率为______.【解析】 设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1.由频率和为1,得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.0.12探究2频率分布直方图的绘制与应用 (课本P193问题1补充)现调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下表所示:2171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168 170 168 160 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1) 作出频率分布表;【解答】最低身高为151 cm,最高身高为180 cm,它们的差是180-151=29,即极差为29.确定组距为4,组数为8,频率分布表如下:分组 频数 频率[149.5,153.5) 1 0.025[153.5,157.5) 3 0.075[157.5,161.5) 6 0.15[161.5,165.5) 9 0.225[165.5,169.5) 14 0.35[169.5,173.5) 3 0.075[173.5,177.5) 3 0.075[177.5,181.5] 1 0.025合计 40 1 (课本P193问题1补充)现调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下表所示:2171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168 170 168 160 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(2) 画出频率分布直方图.【解答】 组距为4,结合频率分布表,可计算各组的,即可得频率分布直方图如图所示.绘制频率分布直方图的关注点(1) 分组:数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组.(2) 关键:画频率分布直方图的关键就是确定小矩形的高,其大小为“频率/组距”.(3) 在频率分布直方图中,各个小长方形的面积等于各组的频率,各组频数之和等于样本容量,频率之和为1.变式 某出租车公司随机调查该公司50辆出租车某天8:00—18:00的营业额(单位:元)情况,结果如下:259 294 295 297 300 300 300 301 301 302303 306 308 309 311 314 315 315 321 323327 328 331 334 336 339 339 339 347 348350 350 352 355 359 359 361 363 370 376377 383 388 389 390 396 404 410 410 411(1) 试根据以上数据制作频率分布表;【解答】 根据已知数据,最大值为411,最小值是259,极差为411-259=152,可将其分为8组,组距为20,频率分布表如下:分组 频数 频率 频率/组距[258,278) 1 0.02 0.001[278,298) 3 0.06 0.003[298,318) 14 0.28 0.014[318,338) 7 0.14 0.007[338,358) 9 0.18 0.009[358,378) 7 0.14 0.007[378,398) 5 0.10 0.005[398,418] 4 0.08 0.004合计 50 1.00 0.05【解析】 频数分布直方图如下: 频率分布直方图如下:通过比较,两者的纵坐标不同,横坐标相同,数据分布情况相同.(2) 绘制频数分布直方图和频率分布直方图,并比较两者的异同.探究3频率分布直方图中的相关计算问题 如图所示是由总体的一个样本绘制的频率分布直方图,且在[15,18)内的频数为8.(1) 求样本在[15,18)内的频率;3【解答】 由样本频率分布直方图可知组距为3,样本在[15,18)内的频率等于×3=.(2) 求样本量;【解答】 样本在[15,18)内的频数为8,由(1)可知,样本量为=8×=50. 如图所示是由总体的一个样本绘制的频率分布直方图,且在[15,18)内的频数为8.(3) 若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.3【解答】 在[12,15)内的小矩形面积为0.06,即样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47.又因为在[15,18)内的频数为8,故在[18,33)内的频数为47-8=39.频率分布直方图的应用中的计算关系(1) 小长方形的面积=组距×=频率.(2) 各小长方形的面积之和等于1.(3) =频率,此关系式的变形为=样本容量,样本容量×频率=频数.变式 (课本P198练习1)从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350 kW·h之间,进行适当分组后(每组为左闭右开的区间),画出如图所示的频率分布直方图.(1) 直方图中x的值为__________;【解析】 由(0.006 0+x+0.003 6+0.002 4×2+0.001 2)×50=1,得x=0.004 4.0.004 4(2) 在被调查的用户中,用电量落在区间[100,250)内的户数为______.【解析】 (0.003 6+0.006 0+0.004 4)×50×100=70.70随堂内化·及时评价1.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为 ( )A.100 B.1 000C.90 D.900【解析】 由题意可知,前三组的频率之和为(0.01+0.024+0.036)×10=0.7,所以支出在[50,60]内的频率为1-0.7=0.3,所以n==100.A2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本数据落在[15,20]内的频数为 ( )A.20 B.30C.40 D.50【解析】 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.B3.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是 ( )A.45 B.50C.55 D.60【解析】 成绩低于60分的频率为(0.005+0.010)×20=0.3,又因为低于60分的人数是15,所以该班的学生人数是=50.B4.如图所示是样本量为200的频率分布直方图.根据样本的频率分布直方图,下列说法正确的是 ( )A.样本数据落在[6,10)内的频数为64,数据落在[2,10)内的百分比为0.4B.样本数据落在[6,10)内的频数为16,数据落在[2,10)内的百分比为0.1C.样本数据落在[10,14)内的频数为18,数据落在[6,14)内的百分比为0.68D.样本数据落在[14,22]内的频数为48,数据落在[10,18)内的百分比为0.12【解析】 根据样本的频率分布直方图,样本数据落在[6,10)内的频率为0.08×4=0.32,所以频数为0.32×200=64;样本数据落在[2,6)内的频率为0.02×4=0.08,所以频数为0.08×200=16,故数据落在[2,10)内的百分比约为=0.4.同理,样本数据落在[10,14)内的频数为72,数据落在[6,14)内的百分比为0.68,样本数据落在[14,22)内的频数为48,数据落在[10,18)内的百分比为0.48.【答案】A5.(课本P198练习2)如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.(1) 通话时长在区间[15,20),[20,30)内的次数分别为多少?【解答】 0.030×5×60=9,0.020×10×60=12,故通话时长在区间[15,20),[20,30)内的次数分别为9,12.5.(课本P198练习2)如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.(2) 区间[20,30)上的小长方形高度低于[15,20)上的小长方形的高度,说明什么?【解答】 说明通话时长在[15,20)上的数据密度大于在区间[20,30)上的数据密度,即区间[20,30)上的小于区间[15,20)上的,说明在平均意义上,区间[20,30)上每单位区间长度内的通话次数小于区间[15,20)上的,或者通话时长出现在区间[20,30)上比出现在[15,20)上更稀疏.9.2 用样本估计总体第1课时 总体取值规律的估计一、 单项选择题1.在一次模拟考试后,从高三某班随机抽取了20位学生的数学成绩,其分布如下表: 分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,50]频数 1 2 6 7 3 1分数在130分(包括130分)以上者为优秀,据此估计该班的优秀率约为( )A.10% B.20%C.30% D.40%2.已知样本数据如下:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11,那么频率为0.2的是( )A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]3.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为,则第三组的频数为( )A.16 B.20C.24 D.364.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是( )(第4题)A.12 B.18C.25 D.90二、 多项选择题5.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论正确的是( )(第5题)A.得分在[40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在[60,80)的频率为0.5C.80分以上的人数是50分以下人数的3倍D.估计得分人数最多的分数段是[50,60)6.已知容量为100的样本,其数据分布在[2,18]中,将样本数据分为4组:[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法正确的是( )(第6题)A.样本数据分布在[6,10)的频率为0.32B.样本数据分布在[10,14)的频数为40C.样本数据分布在[2,10)的频数为40D.估计总体数据大约有10%分布在[10,14)三、 填空题7.为了了解某校今年准备报考飞行员学生的体重(单位:kg)情况,将所得的数据整理后,画出了频率分布直方图如图所示.已知图中从左到右的前3个小组的频率之比为1∶2∶3,其中第2小组的频数为12,则报考飞行员的总人数是________.(第7题)(第8题)8.某班50名学生在一次百米测试中,成绩全部介于13 s与19 s之间.将测试结果按如下方式分成6组:第一组,成绩大于等于13 s且小于14 s;第二组,成绩大于等于14 s且小于15 s;…;第六组,成绩大于等于18 s且小于等于19 s.如图所示是按上述分组方法得到的频率分布直方图,设成绩小于17 s的学生人数占全班总人数的百分比为x,成绩大于等于15 s且小于17 s的学生人数为y,则x和y的值分别为________.四、 解答题9.为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级部分女生身高进行了一次测量,所得数据整理后列出频率分布表如下表所示.分组 频数 频率[145.5,149.5) 1 0.02[149.5,153.5) 4 0.08[153.5,157.5) 20 0.40[157.5,161.5) 15 0.30[161.5,165.5) 8 0.16[165.5,169.5] m n合计 M N(1) 求出表中m,n,M,N的值;(2) 画出频率分布直方图;(3) 全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm及以上的频率.10.为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50 kW·h至350 kW·h之间,进行适当分组后,画出频率分布直方图如图所示.(1) 求a的值;(2) 求被调查用户中,用电量大于200 kW·h的户数;(3) 为了既满足居民的基本用电需求,又能提高能源的利用效率,市政府计划采用阶梯定价,希望使85%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议,并简要说明理由.(第10题)11.某品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,销售额都在区间[5,25](单位:百万元)内,将其分成5组:[5,9),[9,13),[13,17),[17,21),[21,25],并整理得到如图所示的频率分布直方图,据此估计其全部销售员工中销售额在区间[9,13)内的人数为( )(第11题)A.16 B.22C.64 D.8812.(多选)供电部门对某社区1 000位居民12月份人均用电情况进行统计后,按人均用电量分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如图所示的频率分布直方图,则有关这1 000位居民,下列说法正确的是( )(第12题)A.12月份人均用电量人数最多的一组有400人B.12月份人均用电量在[20,30)内的有300人C.12月份人均用电量不低于20度的有500人D.在这1 000位居民中用按比例分配的分层随机抽样方法抽取10位居民协助收费,抽到的居民用电量在[30,40)一组的人数为213.某市某次高中统测学生数学成绩的频率分布直方图如图所示.现按测试成绩由高到低分成A,B,C,D四个等级,其中A级占25%,B级占40%,C级占30%,D级占5%的比例,则C级的分数线与B级的分数线分别为________和________.(第13题)14.学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至31日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图如图所示.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(第14题)(1) 本次活动第________组上交的作品数最多; (2) 经过评比,第四组和第六组分别有10件、2件作品获奖,则这两组中第________组获奖率较高.第1课时 总体取值规律的估计基础打底·熟练掌握1.B 2.D 3.C4.D 【解析】 净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.5.ABD 6.ABC7.48 【解析】 设图中从左到右的第1小组的频率为x,则第2小组的频率为2x,第3小组的频率为3x.由频率分布直方图的性质,得x+2x+3x+0.037×5+0.013×5=1,解得x=0.125,所以第2小组的频率为2x=0.25.又已知第2小组的频数为12,所以报考飞行员的学生人数是12÷0.25=48.8.90% 35 【解析】 由图可得成绩小于17 s的学生的频率,也就是成绩小于17 s的学生所占的百分比是0.02+0.18+0.36+0.34=0.9=90%;成绩大于等于15 s且小于17 s的学生的人数为(0.36+0.34)×50=35.9.【解答】 (1) 方法一:N=1.00,n=1-(0.02+0.08+0.40+0.30+0.16)=0.04,=,解得m=2,M=1+4+20+15+8+2=50.方法二:M==50,m=50-(1+4+20+15+8)=2,N=1.00,n===0.04.(2) 画出频率分布直方图,如图所示.(第9题)(3) 由频率分布直方图可知,样本中身高在[153.5,157.5)范围内的人数最多,且身高在161.5 cm及以上的频率为0.16+0.04=0.20,由此可估计全体女生中身高在[153.5,157.5)范围内的人数最多,九年级学生中女生的身高在161.5 cm及以上的频率约为0.20.10.【解答】 (1) 因为(0.002 4+0.003 6+a+0.004 4+0.002 4+0.001 2)×50=1,所以a=0.006.(2) 根据频率分布直方图可知“用电量大于200 kW·h”的频率为(0.004 4+0.002 4+0.001 2)×50=0.4,所以用电量大于200 kW·h的户数为100×0.4=40,故用电量大于200 kW·h的有40户.(3) 因为前四组的频率和为(0.002 4+0.003 6+0.006+0.004 4)×50=0.82<0.85,前五组的频率和为(0.002 4+0.003 6+0.006+0.004 4+0.002 4)×50=0.94>0.85,所以频率和为0.85时对应的数据在第五组,所以第一档用电标准为250+50×=262.5(kW·h),故第一档用电标准为262.5 kW·h.能力进阶·融会贯通11.C 【解析】 由题意得4×(0.02+a+0.09+0.03+0.03)=1,解得a=0.08,所以销售额在区间[9,13)内的频率为0.32,所以估计全部销售员工中销售额在区间[9,13)内的人数为200×0.32=64.12.ABC 【解析】 根据频率分布直方图知,12月份人均用电量人数最多的一组是[10,20),有1 000×0.04×10=400(人),A正确;12月份人均用电量在[20,30)内的人数为1 000×0.03×10=300,B正确;12月份人均用电量不低于20度的频率是(0.03+0.01+0.01)×10=0.5,有1 000×0.5=500(人),C正确;用电量在[30,40)内的有0.01×10×1 000=100(人),所以在这1 000位居民中用按比例分配的分层随机抽样方法抽取10位居民协助收费,抽到的居民用电量在[30,40)一组的人数为×10=1,D错误.13. 24 49 【解析】 由图可知,分数在[0,20)的频率为0.001×20=0.02,在[20,40)的频率为0.007 5×20=0.15,在[40,60)的频率为0.02×20=0.4,则分数在[0,40)的频率为0.02+0.15=0.17,[0,60)的频率为0.17+0.4=0.57,因此C级的分数线位于[20,40)内,由20+20×=24,所以C级的分数线为24,B级的分数线位于[40,60)内,由40+×20=49,所以B级的分数线为49.14.(1) 四 (2) 六 【解析】 (1) 由题意知第三组的频率为=,又第三组的频数为12,所以作品总数为=60.由频率分布直方图,可以看出第四组上交的作品数量最多,共有60×=18(件).(2) 第四组的获奖率是=,第六组上交的作品有60×=3(件),所以第六组的获奖率为,显然第六组的获奖率较高.9.2 用样本估计总体第1课时 总体取值规律的估计学习 目标 1.结合实例,能用样本估计总体的取值规律,掌握频率分布表的作法以及频率分布直方图的画法; 2.能根据频率分布表和频率分布直方图观测数据的分布规律,能求解有关频率分布直方图的问题.新知初探基础落实问题1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.(1) 如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?每户居民月均用水量标准如果定得太低,会影响很多居民的日常生活;如果标准太高,则不利于节水.为了确定一个合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.(2) 你认为为了较为合理地确定出这个标准,需要做哪些工作?由于城市住户较多,全面普查存在时间和经费问题,没有必要,所以通常采用抽样调查的方式,从样本中获取信息,来估计总体的一些性质和特点.通过分析样本数据来估计全市居民用水量的分布情况.一、 概念生成问题2:通过课本P193—194“问题1”中的数据,你能看出哪些信息?如果将这组数据按从小到大排序,发现这组数据的最小值是1.3 t,最大值是28.0 t,其他在1.3 t和28.0 t之间.问题3:为了更深入地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析.在实际问题中,我们更关心什么问题?月均用水量在不同范围内的居民用户占全市居民用户的比例.我们今天来学习频率分布表和频率分布直方图对样本数据进行整理.如何画频率分布表和频率分布直方图?1.求极差极差为一组数据中最大值与最小值的差.样本观测数据的最小值是1.3 t,最大值是28.0 t,极差为28.0-1.3=26.7,这说明样本观测数据的变化范围是26.7 t.2.决定组距与组数合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.数据分组可以是等距的,也可以是不等距的,要根据数据的特点而定.有时为了方便,往往按等距分组,或者除了第一和最后的两段,其他各段按等距分组.分组时可以先确定组距,也可以先确定组数.如果我们取所有组距为3,则==8.9,即可以将数据分为9组,这也说明这个组距是比较合适的.3.将数据分组由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.例如,可以取区间为[1.2,28.2],按如下方式把样本观测数据以组距3分为9组:[1.2,4.2),[4.2,7.2),…,[25.2,28.2].4.列频率分布表计算各小组的频率,例如第一小组的频率是==0.23,作出频率分布表.分组 频数累计 频数 频率[1.2,4.2) 正正正正 23 0.23[4.2,7.2) 正正正正正正 32 0.32[7.2,10.2) 正正 13 0.13[10.2,13.2) 正 9 0.09[13.2,16.2) 正 9 0.09[16.2,19.2) 正 5 0.05[19.2,22.2) 3 0.03[22.2,25.2) 4 0.04[25.2,28.2] 2 0.02合计 100 1.005.画频率分布直方图根据上表可以得到如图所示的频率分布直方图.请同学阅读课本P193—P198,完成下列填空.二、 概念表述1.频率分布直方图(1) 列出样本数据的频率分布表和频率分布直方图的步骤:①求极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且组距=____;③将数据分组:通常对组内数值取左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小组的频数,除以样本容量,得到各小组的频率.⑤画频率分布直方图:以数据的值为横坐标,以____的值为纵坐标绘制直方图.(2) 频率分布直方图的特点:①小长方形的面积=组距×=频率;②各小长方形的面积和等于1;③小长方形的高=,所有小长方形的高的和=.2.根据频率分布直方图求平均数、中位数和众数(1) 平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3) 众数:众数是最高小矩形底边的中点所对应的数据.三、 概念辨析(判断正误:正确的画“√”,错误的画“×”)(1) 样本容量越大,用样本的频率分布去估计总体的频率分布就越准确.( √ )(2) 频率分布直方图的横轴表示样本数据,纵轴表示频率.( × )(3) 频率分布直方图中各个小长方形的面积之和等于1.( √ )(4) 频率分布直方图中小矩形的面积表示该组的个体数.( × )典例精讲能力初成探究1 频数与频率例1 某市共有5 000名高三学生参加联考,为了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成频率分布表如下:分组/分 频数 频率[80,90) ① ②[90,100) 0.050[100,110) 0.200[110,120) 36 0.300[120,130) 0.275[130,140) 12[140,150] 0.050合计根据上面的频率分布表,可知①处的数值为__3__,②处的数值为__0.025__.【解析】设样本容量为n,由位于[110,120)的频数为36,频率为=0.300,得样本容量n=120,所以位于[130,140)的频率为=0.100.②处的数值为1-0.050-0.200-0.300-0.275-0.100-0.050=0.025,①处的数值为0.025×120=3.对于频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清楚已知和所求,选择合适的公式解题.变式 容量为100的某个样本,数据拆分为10组,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组的频率为__0.12__.【解析】设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1.由频率和为1,得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.探究2 频率分布直方图的绘制与应用例2 (课本P193问题1补充)现调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下表所示:171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168 170 168 160 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1) 作出频率分布表;【解答】最低身高为151 cm,最高身高为180 cm,它们的差是180-151=29,即极差为29.确定组距为4,组数为8,频率分布表如下:分组 频数 频率[149.5,153.5) 1 0.025[153.5,157.5) 3 0.075[157.5,161.5) 6 0.15[161.5,165.5) 9 0.225[165.5,169.5) 14 0.35[169.5,173.5) 3 0.075[173.5,177.5) 3 0.075[177.5,181.5] 1 0.025合计 40 1(2) 画出频率分布直方图.【解答】组距为4,结合频率分布表,可计算各组的,即可得频率分布直方图如图所示.绘制频率分布直方图的关注点(1) 分组:数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组.(2) 关键:画频率分布直方图的关键就是确定小矩形的高,其大小为“频率/组距”.(3) 在频率分布直方图中,各个小长方形的面积等于各组的频率,各组频数之和等于样本容量,频率之和为1.变式 某出租车公司随机调查该公司50辆出租车某天8:00—18:00的营业额(单位:元)情况,结果如下:259 294 295 297 300 300 300 301 301 302303 306 308 309 311 314 315 315 321 323327 328 331 334 336 339 339 339 347 348350 350 352 355 359 359 361 363 370 376377 383 388 389 390 396 404 410 410 411(1) 试根据以上数据制作频率分布表;【解答】根据已知数据,最大值为411,最小值是259,极差为411-259=152,可将其分为8组,组距为20,频率分布表如下:分组 频数 频率 频率/组距[258,278) 1 0.02 0.001[278,298) 3 0.06 0.003[298,318) 14 0.28 0.014[318,338) 7 0.14 0.007[338,358) 9 0.18 0.009[358,378) 7 0.14 0.007[378,398) 5 0.10 0.005[398,418] 4 0.08 0.004合计 50 1.00 0.05(2) 绘制频数分布直方图和频率分布直方图,并比较两者的异同.【解答】频数分布直方图如下:频率分布直方图如下:通过比较,两者的纵坐标不同,横坐标相同,数据分布情况相同.探究3 频率分布直方图中的相关计算问题例3 如图所示是由总体的一个样本绘制的频率分布直方图,且在[15,18)内的频数为8.(1) 求样本在[15,18)内的频率;【解答】由样本频率分布直方图可知组距为3,样本在[15,18)内的频率等于×3=.(2) 求样本量;【解答】样本在[15,18)内的频数为8,由(1)可知,样本量为=8×=50.(3) 若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.【解答】在[12,15)内的小矩形面积为0.06,即样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47.又因为在[15,18)内的频数为8,故在[18,33)内的频数为47-8=39.频率分布直方图的应用中的计算关系(1) 小长方形的面积=组距×=频率.(2) 各小长方形的面积之和等于1.(3) =频率,此关系式的变形为=样本容量,样本容量×频率=频数.变式 (课本P198练习1)从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350 kW·h之间,进行适当分组后(每组为左闭右开的区间),画出如图所示的频率分布直方图.(1) 直方图中x的值为__0.004 4__;【解析】由(0.006 0+x+0.003 6+0.002 4×2+0.001 2)×50=1,得x=0.004 4.(2) 在被调查的用户中,用电量落在区间[100,250)内的户数为__70__.【解析】(0.003 6+0.006 0+0.004 4)×50×100=70.随堂内化及时评价1.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为( A )A.100 B.1 000C.90 D.900【解析】由题意可知,前三组的频率之和为(0.01+0.024+0.036)×10=0.7,所以支出在[50,60]内的频率为1-0.7=0.3,所以n==100.2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本数据落在[15,20]内的频数为( B )A.20 B.30C.40 D.50【解析】样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.3.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是( B )A.45 B.50C.55 D.60【解析】成绩低于60分的频率为(0.005+0.010)×20=0.3,又因为低于60分的人数是15,所以该班的学生人数是=50.4.如图所示是样本量为200的频率分布直方图.根据样本的频率分布直方图,下列说法正确的是( A )A.样本数据落在[6,10)内的频数为64,数据落在[2,10)内的百分比为0.4B.样本数据落在[6,10)内的频数为16,数据落在[2,10)内的百分比为0.1C.样本数据落在[10,14)内的频数为18,数据落在[6,14)内的百分比为0.68D.样本数据落在[14,22]内的频数为48,数据落在[10,18)内的百分比为0.12【解析】根据样本的频率分布直方图,样本数据落在[6,10)内的频率为0.08×4=0.32,所以频数为0.32×200=64;样本数据落在[2,6)内的频率为0.02×4=0.08,所以频数为0.08×200=16,故数据落在[2,10)内的百分比约为=0.4.同理,样本数据落在[10,14)内的频数为72,数据落在[6,14)内的百分比为0.68,样本数据落在[14,22)内的频数为48,数据落在[10,18)内的百分比为0.48.5.(课本P198练习2)如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.(1) 通话时长在区间[15,20),[20,30)内的次数分别为多少?【解答】0.030×5×60=9,0.020×10×60=12,故通话时长在区间[15,20),[20,30)内的次数分别为9,12.(2) 区间[20,30)上的小长方形高度低于[15,20)上的小长方形的高度,说明什么?【解答】说明通话时长在[15,20)上的数据密度大于在区间[20,30)上的数据密度,即区间[20,30)上的小于区间[15,20)上的,说明在平均意义上,区间[20,30)上每单位区间长度内的通话次数小于区间[15,20)上的,或者通话时长出现在区间[20,30)上比出现在[15,20)上更稀疏. 展开更多...... 收起↑ 资源列表 9.2 第1课时 总体取值规律的估计.docx 9.2 第1课时 总体取值规律的估计.pptx 9.2 第1课时 总体取值规律的估计(练习,含解析).docx