资源简介 (共38张PPT)第九章9.2 用样本估计总体统 计第5课时 总体离散程度的估计学习 目标 1.结合实例,能用样本估计总体的离散程度参数(标准差、方差),会求方差、标准差.2.理解求分层随机抽样总样本和样本的平均数及方差的方法,理解离散程度参数的统计含义.新知初探·基础落实问题1:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4乙 9 5 7 8 7 6 8 6 7 7如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数、众数都是7.从这个角度看,两名运动员之间没有差别.但从图中看,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.那么,如何度量成绩的这种差异呢?一种简单的度量数据离散程度的方法就是用极差.甲乙根据甲、乙运动员的10次射击成绩,可以得到甲命中环数的极差为10-4=6,乙命中环数的极差为9-5=4.可以发现甲的成绩波动范围比乙的大.极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.一、 概念生成问题2:你还能想出其他刻画数据离散程度的办法吗?我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.思考:如何定义“平均距离”?假设一组数据是x1,x2,…,xn,用表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即|xi-| (i=1,2,…,n)作为xi到的“距离”.可以得到这组数据x1,x2,…,xn到的“平均距离”为|xi-|.为了避免式中含有绝对值,通常改用平方来代替,即(xi-)2.(1)我们称(1)式为这组数据的方差.有时为了计算方差的方便,我们还把方差写成以下形式-.想一想:为什么用“平均距离”刻画离散程度,用“总距离”行吗?请同学阅读课本P211—P214,完成下列填空.二、 概念表述1.总体方差和标准差(1) 总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称___________________为总体方差,__________为总体标准差.(2) 总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为____________________.S2=(Yi-)2S=S2=fi(Yi-)22.样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称____________________为样本方差,__________为样本标准差.3.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.s2=(yi-)2s=三、 概念辨析(判断正误:正确的画“√”,错误的画“×”)(1) 数据的极差越小,样本数据分布越集中、稳定. ( )(2) 数据的方差越大,样本数据分布越集中、稳定. ( )(3) 数据的标准差越小,数据分布越集中、波动幅度越小. ( )(4) 在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差. ( )√×√√典例精讲·能力初成探究1标准差与方差的应用视角1 总体方差和标准差 为了了解人们对某种食材营养价值的认识程度,某档健康养生电视节目组织8名营养专家和8名现场观众各组成一个评分小组,给食材的营养价值打分(十分制).下面是两个小组的打分数据:1-1第一小组 8.2 7.5 6.4 9.5 8.3 8.0 1.5 6.6第二小组 8.8 8.5 9.5 8.6 9.2 8.2 8.9 8.7(1) 求第一小组数据的中位数与平均数,用这两个数字特征中的哪一种来描述第一小组打分的情况更合适?说明你的理由;【解答】 第一小组的打分从小到大可排序为1.5,6.4,6.6,7.5,8.0,8.2,8.3,9.5,则中位数为=7.75,平均数为=×(1.5+6.4+6.6+7.5+8.0+8.2+8.3+9.5)=×56=7,可发现第一小组中出现极端数据1.5,会造成平均数偏低,则由以上算得的两个数字特征可知,选择中位数7.75更适合描述第一小组打分的情况.【解答】 第一小组:=7,=×[(8.2-7)2+(7.5-7)2+(6.4-7)2+(9.5-7)2+(8.3-7)2+(8.0-7)2+(1.5-7)2+(6.6-7)2]=×41.4=5.175;第二小组:=×(8.8+8.5+9.5+8.6+9.2+8.2+8.9+8.7)=8.8,=×[(8.8-8.8)2+(8.5-8.8)2+(9.5-8.8)2+(8.6-8.8)2+(9.2-8.8)2+(8.2-8.8)2+(8.9-8.8)2+(8.7-8.8)2]=×1.16=0.145.故,第一小组的方差远大于第二小组的方差,第二小组的打分相对集中,故第二小组的打分人员更像是由营养专家组成的.(2) 你能否判断第一小组与第二小组哪一个更像是由营养专家组成的吗?请比较数字特征并说明理由.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越高.变式 为了参加某数学竞赛,某高级中学对高二年级理科、文科两个数学兴趣小组的同学进行了赛前模拟测试,成绩(单位:分)记录如下,理科:79,81,81,79,94,92,85,89;文科:94,80,90,81,73,84,90,80.计算理科、文科两组同学成绩的平均数和方差,并从统计学的角度分析哪组同学在此次模拟测试中发挥比较好.【解答】 理科组成绩:=×(79+79+81+81+85+89+92+94)=85(分),=×[(79-85)2+(79-85)2+(81-85)2+(81-85)2+(85-85)2+(89-85)2+(92-85)2+(94-85)2]=31.25.文科组成绩:=×(73+80+80+81+84+90+90+94)=84(分),方差=×[(73-84)2+(80-84)2+(80-84)2+(81-84)2+(84-84)2+(90-84)2+(90-84)2+(94-84)2]=41.75.因为,所以从统计学的角度分析,理科组同学在此次模拟测试中发挥比较好.视角2 用样本平均数和样本标准差估计总体 (课本P213例6补充)某学校在上报《国家学生体质健康标准》高一年级学生的肺活量单项数据中,采用样本量按比例分配的分层随机抽样法.如果不知道样本数据,只知道抽取了男生20人,其肺活量平均数为 3 000 mL,方差为100;抽取了女生30人,其肺活量平均数为2 500 mL,方差为400.估计高一年级全体学生肺活量的平均数与方差.1-2【解答】 把男生样本数据记为x1,x2,…,x20,其平均数记为,方差记为.把女生样本数据记为y1,y2,…,y30,其平均数记为,方差记为.把总样本数据的平均数记为,方差记为s2.由题知=3 000,=2 500,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得=+=×3 000+×2 500=2 700,s2=(xi-)2+(yj-)2]=(xi-+-)2+(yj-+-)2].由(xi-)=xi-20=0,可得2(xi-)(-)=2(-(xi-)=0.同理可得2(yj-)(-)=0.因此s2=(xi-)2+-)2+(yj-)2+-)2]={20[+(-)2]+30[+(-)2]}=×{20×[100+(3 000-2 700)2]+30×[400+(2 500-2 700)2]}=60 280.估计高一年级全体学生肺活量的平均数为2 700 mL,方差为60 280.用样本的标准差、方差估计总体的方法(1) 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.(2) 标准差、方差的取值范围是[0,+∞).(3) 因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.变式 甲、乙两支田径队体检结果为:甲队体重的平均数为60 kg,方差为200;乙队体重的平均数为70 kg,方差为300.又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是多少?【解答】 由题意可知=60,甲队队员在所有队员中所占比例为=;=70,乙队队员在所有队员中所占比例为=.故甲、乙两队全部队员的平均体重为=×60+×70=68(kg),甲、乙两队全部队员的体重的方差为s2=×[200+(60-68)2]+×[300+(70-68)2]=296.探究2方差、标准差的性质 (多选)已知一组样本数据x1,x2,…,xn为不全相等的n个正数,其中n≥4,若由yk=3xk-2(k=1,2,…,n)生成一组新的数据y1,y2,…,yn,则这组新数据与原数据中可能相等的量有 ( )A.极差 B.平均数C.中位数 D.标准差2【解析】 对于A,因为样本数据x1,x2,…,xn为不全相等的n个正数,所以极差大于0,所以由yk=3xk-2(k=1,2,…,n)生成一组新的yi的极差是xi极差的3倍,故A错误;对于B,设为x1,x2,…,xn的平均数,为y1,y2,…,yn的平均数,可得=3-2,当=1时,可得=1,故B正确;对于C,当n为正奇数时,设样本数据x1,x2,…,xn的中位数为xk,则数据y1,y2,…,yn的中位数yk=3xk-2,当xk=1时,yk=3xk-2=1,故C正确;对于D,s1为x1,x2,…,xn的标准差,因为样本数据x1,x2,…,xn为不全相等的n个正数,所以s1≠0,设s2为y1,y2,…,yn的标准差,可得=3-2,则s1=,s2===3s1,故D错误.【答案】BC变式 已知数据x1,x2,…,x10的极差为8,方差为6,则数据3x1+1,3x2+1,…,3x10+1的极差和方差分别为 ( )A.24,19 B.25,19C.24,54 D.25,54【解析】 不妨设x1≤x2≤…≤x10,则x10-x1=8,且3x1+1≤3x2+1≤…≤3x10+1,所以(3x10+1)-(3x1+1)=24,所以数据3x1+1,3x2+1,…,3x10+1的极差为24.设x1,x2,…,x10的平均数为,则[(x1-)2+(x2-)2+…+(x10-)2]=6.又数据3x1+1,3x2+1,…,3x10+1的平均数为[(3x1+1)+(3x2+1)+…+(3x10+1)]=3+1,所以数据3x1+1,3x2+1,…,3x10+1的方差s2={[(3x1+1)-(3+1)]2+[(3x2+1)-(3+1)]2+…+[(3x10+1)-(3+1)]2}=9×[(x1-)2+(x2-)2+…+(x10-)2]=54.【答案】C探究3方差、标准差与统计图表的综合应用 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1) 分别求出两人得分的平均数与方差;3【解答】 由题图可得甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;乙:13,14,12,12,14.==13,==13,=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(2) 根据图形和(1)中计算结果,对两人的训练成绩作出评价.3【解答】 由(1)知,则乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.折线统计图中数字特征的求解技巧(1) 根据折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关;(2) 一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.变式 (多选)PM2.5是衡量空气质量的重要指标. 右图是某地7月1日到10日的PM2.5日均值(单位:μg/m3)的折线图,则下列关于这10天中PM2.5日均值的说法正确的是 ( )A.众数为30B.中位数是31C.平均数小于中位数D.后4天的方差小于前4天的方差【解析】 众数即是出现次数最多的数字,由折线图可得,众数为30,故A正确;中位数即是处在中间位置的数字,将折线图中数字由小到大依次排序,得17,25,30,30,31,32,34,38,42,126,处在中间位置的数字是31,32,因此中位数为31.5,故B错误;平均数为×(17+25+30+30+31+32+34+38+42+126)=40.5>31.5,故C错误;前4天的平均数为=27.5,后4天的平均数为=33.75,前4天的方差为=×[(38-27.5)2+(25-27.5)2+(17-27.5)2+(30-27.5)2]=58.25,后4天的方差为=×[(42-33.75)2+(31-33.75)2+(32-33.75)2+(30-33.75)2]=23.187 5,所以后4天的方差小于前4天的方差,故D正确.(对于D,因为后4天的PM2.5日均值的波动更小,所以后4天的方差小于前4天的方差,故D正确)【答案】AD随堂内化·及时评价1.已知数据x1,x2,…,xn的平均数=5,方差s2=4,则数据3x1+7,3x2+7,…,3xn+7的平均数和标准差分别为 ( )A.15,36 B.22,6C.15,6 D.22,36B2.随机调查某校50个学生的早餐费,结果如下表,这50个学生早餐费的平均值和方差分别是 ( ) A.4,0.6 B.4,C.4.2,0.56 D.4.2,早餐费/元 3 4 5人数 10 20 20C3.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则·s2= ( )A.7 B.6C.3 D.2【解析】 8个数的平均数为=×(4×7+4)=4,方差为s2=×(7×2+02)=,则·s2=4×=7.A4.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为x,y,105,109,110.已知该同学五次数学成绩的平均数为108,方差为35.2,则|x-y|的值为 ( )A.15 B.16C.17 D.18【解析】 由题意得=108①,=35.2②,由①②解得所以|x-y|=18.D5.(课本P215练习2)数据x1,x2,…,xn的方差为,数据y1,y2,…,yn的方差为,a,b为常数.证明:(1) 如果y1=x1+b,y2=x2+b,…,yn=xn+b,那么=;【解答】 设数据x1,x2,…,xn的平均数为.因为y1=x1+b,y2=x2+b,…,yn=xn+b,所以数据y1,y2,…,yn的平均数=(xi+b)=xi+b=+b,方差=[xi+b-(+b)]2==.5.(课本P215练习2)数据x1,x2,…,xn的方差为,数据y1,y2,…,yn的方差为,a,b为常数.证明:(2) 如果y1=ax1,y2=ax2,…,yn=axn,那么=a2.【解答】 因为y1=ax1,y2=ax2,…,yn=axn,所以数据y1,y2,…,yn的平均数=axi=a×xi=,方差==a2×=a2.第5课时 总体离散程度的估计一、 单项选择题1.已知五个数2,7,8,5,a的平均数为5,则这五个数的方差为( )A.5.2 B.5C.4.8 D.4.62.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7.去掉一个最高分和一个最低分,所剩数据的平均值和方差分别为( )A.9.4,0.484 B.9.4,0.016C.9.5,0.04 D.9.5,0.016(第3题)3.如图所示是小王与小张二人参加某射击比赛预赛的五次测试成绩的折线图,设小王与小张成绩的样本平均数分别为和,方差分别为和,则( )A., B.,C., D.,4.已知数据x1,x2,…,x10的极差为8,方差为6,则数据3x1+1,3x2+1,…,3x10+1的极差和方差分别为( )A.24,19 B.25,19C.24,54 D.25,54二、 多项选择题5.已知某跳水运动员在一次集训中7位裁判给出的分数分别为9.1,9.3,9.4,9.6,9.8,10,10,则这组数据的( )A.平均数为9.6 B.众数为10C.第80百分位数为9.8 D.方差为6.PM2.5是衡量空气质量的重要指标.如图所示是某地9月1日到10日的PM2.5日均值(单位:μg/m3)的折线图,则下列说法正确的是( )(第6题)A.这10天中PM2.5日均值的众数为33B.这10天中PM2.5日均值的中位数是32C.这10天中PM2.5日均值的中位数大于平均数D.这10天中PM2.5日均值前4天的方差大于后4天的方差三、 填空题7.设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1+6,10x2+6,…,10xn+6的方差为________.8.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:等待时间/分 [0,5) [5,10) [10,15) [15,20) [20,25]频数 4 8 5 2 1用上述分组资料计算出病人平均等待时间的估计值=________,病人等待时间方差的估计值s2= ________.四、 解答题9.在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差分别为56.2和11.8,试根据这些数据计算这名选手得分的平均数和标准差.10.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.(第10题)(1) 请填写下表:平均数 方差 中位数 命中9环及9环以上的次数甲乙(2) 请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(谁的成绩更稳定);②从平均数和中位数相结合看(谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(谁的成绩好些);④从折线统计图上两人射击命中环数的走势看(谁更有潜力).11.设实数x,y满足4≤x≤y,若数据1,3,4,x,y,y+2的平均数和第50百分位数相等,则数据x,y,y+2的方差为( )A. B.C. D.12.为了学习、宣传和践行党的二十大精神,某班组织全班学生开展了以“学党史、知国情、圆梦想”为主题的党史暨时政知识竞赛活动.已知该班男生20人,女生30人,根据统计分析,男生组成绩和女生组成绩的方差分别为,.记该班成绩的方差为s2,则下列判断正确的是( )A.s2= B.s2≥C.s2= D.s2≥13.(多选)已知10个样本数据,若去掉其中最大和最小的数据,设剩下的8个样本数据的方差为,平均数为;最大和最小两个数据的方差为,平均数为;原样本数据的方差为s2,平均数为,若=,则( )A.剩下的8个样本数据与原样本数据的中位数相等 B.=C.剩下8个数据的下四分位数大于原样本数据的下四分位数D.s2=+14.设样本数据x1,x2,…,x2 026的平均数为,方差为s2,若数据2(x1+1),2(x2+1),…,2(x2 026+1)的平均数比方差大4,则s2-的最大值是 ________.第5课时 总体离散程度的估计基础打底·熟练掌握1.A 2.D 3.C4.C 【解析】 不妨设x1≤x2≤…≤x10,则x10-x1=8,且3x1+1≤3x2+1≤…≤3x10+1,所以(3x10+1)-(3x1+1)=24,所以数据3x1+1,3x2+1,…,3x10+1的极差为24.设x1,x2,…,x10的平均数为,所以[(x1-)2+(x2-)2+…+(x10-)2]=6.又数据3x1+1,3x2+1,…,3x10+1的平均数为[3x1+1+3x2+1+…+3x10+1]=3+1,所以数据3x1+1,3x2+1,…,3x10+1的方差为s2={[(3x1+1)-(3+1)]2+[(3x2+1)-(3+1)]2+…+[(3x10+1)-(3+1)]2}=9×[(x1-)2+(x2-)2+…+(x10-)2]=54.5.ABD 【解析】 对于A,平均数为×(9.1+9.3+9.4+9.6+9.8+10+10)=9.6,故A正确;对于B,出现次数最多的数为10,故B正确;对于C,7×0.8=5.6,第80百分位数为第6位,即10,故C错误;对于D,方差为×[(9.1-9.6)2+(9.3-9.6)2+(9.4-9.6)2+(9.6-9.6)2+(9.8-9.6)2+2×(10-9.6)2]=,故D正确.6.ABD 【解析】 由折线图得,这10天中PM2.5日均值的众数为33,中位数为=32,平均数为×(36+26+17+23+33+128+42+31+30+33)=39.9,中位数小于平均数;前4天的数据波动比后4天的波动大,故前4天的方差大于后4天的方差.7.1 【解析】 因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.8.9.5 28.5 【解析】 =×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5,s2=×[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5.9.【解答】 把专业人士打分数据记为x1,x2,…,x8,其平均数记为,方差记为;把观众代表打分数据记为y1,y2,…,y12,其平均数为,方差记为;把总体数据的平均数记为,方差记为s2.则=×47.4+×56.2=52.68,s2=={8[+(-)2]+12[+(-)2]}={8×[3.72+(47.4-52.68)2]+12×[11.82+(56.2-52.68)2]}≈107.6,总样本标准差s≈10.37.所以估计这名选手得分的平均数为52.68,标准差为10.37.10.【解答】 (1) 由图可知,甲射靶的成绩分别为9,5,7,8,7,6,8,6,7,7;乙射靶的成绩分别为2,4,6,8,7,7,8,9,9,10.甲的平均数为7,方差为1.2,中位数是7,命中9环及9环以上的次数为1;乙的平均数为7,方差为5.4,中位数是7.5,命中9环及9环以上次数为3.如下表:平均数 方差 中位数 命中9环及9环以上的次数甲 7 1.2 7 1乙 7 5.4 7.5 3(2) ①甲、乙的平均数相同,乙的方差较大,所以甲的成绩更稳定;②甲、乙的平均数相同,乙的中位数较大,所以乙的成绩好些;③甲、乙的平均数相同,乙命中9环及9环以上的次数比甲多,所以乙的成绩好些;④从折线统计图上看,在后半部分,乙呈上升趋势,而甲起伏不定,且均未超过乙,故乙更有潜力.能力进阶·融会贯通11.B 【解析】 方法一:数据1,3,4,x,y,y+2的第50百分位数为,所以=,化简得y=x+1,此时x,y,y+2即x,x+1,x+3,这组数据的平均值为x+,方差s2=×=.方法二:数据1,3,4,x,y,y+2的第50百分位数为,所以=,化简得y=x+1,此时x,y,y+2即x,x+1,x+3,不妨设x=5,此时这组数据为5,6,8,容易求出这组数据的方差为.12.D 【解析】 记男生组成绩和女生组成绩的平均数分别为,,则=[(x1-)2+(x2-)2+…+(x20-)2]=[++…+-2(x1+x2+…+x20)+20]=++…+-40+20)=++…+-20)=-.同理=-,所以=20+20,=30+30.该班成绩的平均数为=(20+30)=,所以s2=-=++-=+-)2≥.13.ABD 【解析】 设这10个样本数据由小到大依次为m1,m2,m3,…,m10(m1≤m2≤m3≤…≤m10).对于A,这10个样本数据的中位数为,剩下的8个样本数据m2,m3,…,m8,m9的中位数为,故剩下的8个样本数据与原样本数据的中位数相等,故A正确.对于B,由=,得10=m1+m2+…+m10;由=,得8=m2+m3+…+m9;由=,得2=m1+m10,故10=8+2.又=,则10=8+2=10,所以有=,故B正确.对于C,由8×25%=2,为整数,得剩下8个数据的下四分位数为;由10×25%=2.5,不是整数,得原样本数据的下四分位数为m3.因为m4≥m3,则≥m3,所以两个下四分位数可能相等,故C错误.对于D,由B中分析知,==,又s2=[(m1-)2+(m2-)2+…+(m10-)2],=[(m2-)2+(m3-)2+…+(m9-)2],=[(m1-)2+(m10-)2],所以10s2=(m1-)2+(m2-)2+…+(m10-)2=8+2,所以s2=+,故D正确.14.-1 【解析】 数据2(x1+1),2(x2+1),…,2(x2 026+1)的平均数为2(+1),方差为22s2=4s2,所以2(+1)-4s2=4,即s2=-,则s2-=--=--,因为-≥0,所以≥1,又函数y=--在[1,+∞)上单调递减,故当=1时,s2-取得最大值-1.第5课时 总体离散程度的估计学习 目标 1.结合实例,能用样本估计总体的离散程度参数(标准差、方差),会求方差、标准差. 2.理解求分层随机抽样总样本和样本的平均数及方差的方法,理解离散程度参数的统计含义.新知初探基础落实问题1:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4乙 9 5 7 8 7 6 8 6 7 7如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数、众数都是7.从这个角度看,两名运动员之间没有差别.甲乙但从图中看,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.那么,如何度量成绩的这种差异呢?一种简单的度量数据离散程度的方法就是用极差.根据甲、乙运动员的10次射击成绩,可以得到甲命中环数的极差为10-4=6,乙命中环数的极差为9-5=4.可以发现甲的成绩波动范围比乙的大.极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.一、 概念生成问题2:你还能想出其他刻画数据离散程度的办法吗?我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.思考:如何定义“平均距离”?假设一组数据是x1,x2,…,xn,用表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即|xi-| (i=1,2,…,n)作为xi到的“距离”.可以得到这组数据x1,x2,…,xn到的“平均距离”为|xi-|.为了避免式中含有绝对值,通常改用平方来代替,即(xi-)2.(1)我们称(1)式为这组数据的方差.有时为了计算方差的方便,我们还把方差写成以下形式-.想一想:为什么用“平均距离”刻画离散程度,用“总距离”行吗?请同学阅读课本P211—P214,完成下列填空.二、 概念表述1.总体方差和标准差(1) 总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称__S2=(Yi-)2__为总体方差,__S=__为总体标准差.(2) 总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为__S2=fi(Yi-)2__.2.样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称__s2=(yi-)2__为样本方差,__s=__为样本标准差.3.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.三、 概念辨析(判断正误:正确的画“√”,错误的画“×”)(1) 数据的极差越小,样本数据分布越集中、稳定.( √ )(2) 数据的方差越大,样本数据分布越集中、稳定.( × )(3) 数据的标准差越小,数据分布越集中、波动幅度越小.( √ )(4) 在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差.( √ )典例精讲能力初成探究1 标准差与方差的应用视角1 总体方差和标准差例1-1 为了了解人们对某种食材营养价值的认识程度,某档健康养生电视节目组织8名营养专家和8名现场观众各组成一个评分小组,给食材的营养价值打分(十分制).下面是两个小组的打分数据:第一小组 8.2 7.5 6.4 9.5 8.3 8.0 1.5 6.6第二小组 8.8 8.5 9.5 8.6 9.2 8.2 8.9 8.7(1) 求第一小组数据的中位数与平均数,用这两个数字特征中的哪一种来描述第一小组打分的情况更合适?说明你的理由;【解答】第一小组的打分从小到大可排序为1.5,6.4,6.6,7.5,8.0,8.2,8.3,9.5,则中位数为=7.75,平均数为=×(1.5+6.4+6.6+7.5+8.0+8.2+8.3+9.5)=×56=7,可发现第一小组中出现极端数据1.5,会造成平均数偏低,则由以上算得的两个数字特征可知,选择中位数7.75更适合描述第一小组打分的情况.(2) 你能否判断第一小组与第二小组哪一个更像是由营养专家组成的吗?请比较数字特征并说明理由.【解答】第一小组:=7,=×[(8.2-7)2+(7.5-7)2+(6.4-7)2+(9.5-7)2+(8.3-7)2+(8.0-7)2+(1.5-7)2+(6.6-7)2]=×41.4=5.175;第二小组:=×(8.8+8.5+9.5+8.6+9.2+8.2+8.9+8.7)=8.8,=×[(8.8-8.8)2+(8.5-8.8)2+(9.5-8.8)2+(8.6-8.8)2+(9.2-8.8)2+(8.2-8.8)2+(8.9-8.8)2+(8.7-8.8)2]=×1.16=0.145.故,第一小组的方差远大于第二小组的方差,第二小组的打分相对集中,故第二小组的打分人员更像是由营养专家组成的.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越高.变式 为了参加某数学竞赛,某高级中学对高二年级理科、文科两个数学兴趣小组的同学进行了赛前模拟测试,成绩(单位:分)记录如下,理科:79,81,81,79,94,92,85,89;文科:94,80,90,81,73,84,90,80.计算理科、文科两组同学成绩的平均数和方差,并从统计学的角度分析哪组同学在此次模拟测试中发挥比较好.【解答】理科组成绩:=×(79+79+81+81+85+89+92+94)=85(分),=×[(79-85)2+(79-85)2+(81-85)2+(81-85)2+(85-85)2+(89-85)2+(92-85)2+(94-85)2]=31.25.文科组成绩:=×(73+80+80+81+84+90+90+94)=84(分),方差=×[(73-84)2+(80-84)2+(80-84)2+(81-84)2+(84-84)2+(90-84)2+(90-84)2+(94-84)2]=41.75.因为,所以从统计学的角度分析,理科组同学在此次模拟测试中发挥比较好.视角2 用样本平均数和样本标准差估计总体例1-2 (课本P213例6补充)某学校在上报《国家学生体质健康标准》高一年级学生的肺活量单项数据中,采用样本量按比例分配的分层随机抽样法.如果不知道样本数据,只知道抽取了男生20人,其肺活量平均数为 3 000 mL,方差为100;抽取了女生30人,其肺活量平均数为2 500 mL,方差为400.估计高一年级全体学生肺活量的平均数与方差.【解答】把男生样本数据记为x1,x2,…,x20,其平均数记为,方差记为.把女生样本数据记为y1,y2,…,y30,其平均数记为,方差记为.把总样本数据的平均数记为,方差记为s2.由题知=3 000,=2 500,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得=+=×3 000+×2 500=2 700,s2=(xi-)2+(yj-)2]=(xi-+-)2+(yj-+-)2].由(xi-)=xi-20=0,可得2(xi-)(-)=2(-(xi-)=0.同理可得2(yj-)(-)=0.因此s2=(xi-)2+-)2+(yj-)2+-)2]={20[+(-)2]+30[+(-)2]}=×{20×[100+(3 000-2 700)2]+30×[400+(2 500-2 700)2]}=60 280.估计高一年级全体学生肺活量的平均数为2 700 mL,方差为60 280.用样本的标准差、方差估计总体的方法(1) 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.(2) 标准差、方差的取值范围是[0,+∞).(3) 因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.变式 甲、乙两支田径队体检结果为:甲队体重的平均数为60 kg,方差为200;乙队体重的平均数为70 kg,方差为300.又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是多少?【解答】由题意可知=60,甲队队员在所有队员中所占比例为=;=70,乙队队员在所有队员中所占比例为=.故甲、乙两队全部队员的平均体重为=×60+×70=68(kg),甲、乙两队全部队员的体重的方差为s2=×[200+(60-68)2]+×[300+(70-68)2]=296.探究2 方差、标准差的性质例2 (多选)已知一组样本数据x1,x2,…,xn为不全相等的n个正数,其中n≥4,若由yk=3xk-2(k=1,2,…,n)生成一组新的数据y1,y2,…,yn,则这组新数据与原数据中可能相等的量有( BC )A.极差 B.平均数C.中位数 D.标准差【解析】对于A,因为样本数据x1,x2,…,xn为不全相等的n个正数,所以极差大于0,所以由yk=3xk-2(k=1,2,…,n)生成一组新的yi的极差是xi极差的3倍,故A错误;对于B,设为x1,x2,…,xn的平均数,为y1,y2,…,yn的平均数,可得=3-2,当=1时,可得=1,故B正确;对于C,当n为正奇数时,设样本数据x1,x2,…,xn的中位数为xk,则数据y1,y2,…,yn的中位数yk=3xk-2,当xk=1时,yk=3xk-2=1,故C正确;对于D,s1为x1,x2,…,xn的标准差,因为样本数据x1,x2,…,xn为不全相等的n个正数,所以s1≠0,设s2为y1,y2,…,yn的标准差,可得=3-2,则s1=,s2===3s1,故D错误.变式 已知数据x1,x2,…,x10的极差为8,方差为6,则数据3x1+1,3x2+1,…,3x10+1的极差和方差分别为( C )A.24,19 B.25,19C.24,54 D.25,54【解析】不妨设x1≤x2≤…≤x10,则x10-x1=8,且3x1+1≤3x2+1≤…≤3x10+1,所以(3x10+1)-(3x1+1)=24,所以数据3x1+1,3x2+1,…,3x10+1的极差为24.设x1,x2,…,x10的平均数为,则[(x1-)2+(x2-)2+…+(x10-)2]=6.又数据3x1+1,3x2+1,…,3x10+1的平均数为[(3x1+1)+(3x2+1)+…+(3x10+1)]=3+1,所以数据3x1+1,3x2+1,…,3x10+1的方差s2={[(3x1+1)-(3+1)]2+[(3x2+1)-(3+1)]2+…+[(3x10+1)-(3+1)]2}=9×[(x1-)2+(x2-)2+…+(x10-)2]=54.探究3 方差、标准差与统计图表的综合应用例3 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1) 分别求出两人得分的平均数与方差;【解答】由题图可得甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;乙:13,14,12,12,14.==13,==13,=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2) 根据图形和(1)中计算结果,对两人的训练成绩作出评价.【解答】由(1)知,则乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.折线统计图中数字特征的求解技巧(1) 根据折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关;(2) 一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.变式 (多选)PM2.5是衡量空气质量的重要指标.下图是某地7月1日到10日的PM2.5日均值(单位:μg/m3)的折线图,则下列关于这10天中PM2.5日均值的说法正确的是( AD )A.众数为30B.中位数是31C.平均数小于中位数D.后4天的方差小于前4天的方差【解析】众数即是出现次数最多的数字,由折线图可得,众数为30,故A正确;中位数即是处在中间位置的数字,将折线图中数字由小到大依次排序,得17,25,30,30,31,32,34,38,42,126,处在中间位置的数字是31,32,因此中位数为31.5,故B错误;平均数为×(17+25+30+30+31+32+34+38+42+126)=40.5>31.5,故C错误;前4天的平均数为=27.5,后4天的平均数为=33.75,前4天的方差为=×[(38-27.5)2+(25-27.5)2+(17-27.5)2+(30-27.5)2]=58.25,后4天的方差为=×[(42-33.75)2+(31-33.75)2+(32-33.75)2+(30-33.75)2]=23.187 5,所以后4天的方差小于前4天的方差,故D正确.(对于D,因为后4天的PM2.5日均值的波动更小,所以后4天的方差小于前4天的方差,故D正确)随堂内化及时评价1.已知数据x1,x2,…,xn的平均数=5,方差s2=4,则数据3x1+7,3x2+7,…,3xn+7的平均数和标准差分别为( B )A.15,36 B.22,6C.15,6 D.22,362.随机调查某校50个学生的早餐费,结果如下表,这50个学生早餐费的平均值和方差分别是( C )早餐费/元 3 4 5人数 10 20 20A.4,0.6 B.4,C.4.2,0.56 D.4.2,3.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则·s2=( A )A.7 B.6C.3 D.2【解析】8个数的平均数为=×(4×7+4)=4,方差为s2=×(7×2+02)=,则·s2=4×=7.4.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为x,y,105,109,110.已知该同学五次数学成绩的平均数为108,方差为35.2,则|x-y|的值为( D )A.15 B.16C.17 D.18【解析】由题意得=108①,=35.2②,由①②解得或所以|x-y|=18.5.(课本P215练习2)数据x1,x2,…,xn的方差为,数据y1,y2,…,yn的方差为,a,b为常数.证明:(1) 如果y1=x1+b,y2=x2+b,…,yn=xn+b,那么=;【解答】设数据x1,x2,…,xn的平均数为.因为y1=x1+b,y2=x2+b,…,yn=xn+b,所以数据y1,y2,…,yn的平均数=(xi+b)=xi+b=+b,方差=[xi+b-(+b)]2==.(2) 如果y1=ax1,y2=ax2,…,yn=axn,那么=a2.【解答】因为y1=ax1,y2=ax2,…,yn=axn,所以数据y1,y2,…,yn的平均数=axi=a×xi=,方差==a2×=a2. 展开更多...... 收起↑ 资源列表 9.2 第5课时 总体离散程度的估计.docx 9.2 第5课时 总体离散程度的估计.pptx 9.2 第5课时 总体离散程度的估计(练习,含解析).docx