资源简介 (共12张PPT)3.3 离差平方和与方差第2课时 数据的分组第3章 数据分析初步01基础进阶02素能攀升目录1. 将数据 1,4,6,7,10,12,13 分成前 3 个一组,后 4 个一组,则这两组数据的组内离差平方和为( B )A. + B. +21 C. + D. +B1234562. 把数据2,8,10,4,12按大小顺序分成两组,能使“组内离差平方和达到最小”的是( B )A. {2},{4,8,10,12} B. {2,4},{8,10,12}C. {2,4,8},{10,12} D. {2,4,8,10},{12}B1234563. 将数据 5,6,9,10,12,14,15 分成前 4 个一组,后 3 个一组,求这两组数据的组内离差平方和.第一组数据:5,6,9,10.平均数1= = .离差平方和 =2+(6- )2+(9- )2+(10- )2= + + + =17.123456第二组数据:12,14,15.平均数2= = .离差平方和 =2+2+2= + += .这两组数据的组内离差平方和D2= + =17+ = .1234564. 某地一周的日平均风速分别为(单位:m/s):3,5,6,8,10,12,14.为了分析风速对植被生长的影响,需要将这周的风速数据分成两组,该怎么分比较合理?可以按照“工作日(周一至周五)”和“休息日(周六、周日)”分组,或者按照“风速较低组”和“风速较高组”(以中位数为界,中位数为8,故分组为3,5,6,8和10,12,14).从分析对植被生长影响的角度,按“风速区间(低风速、高风速)”分组更能体现风速差异对植被的影响,即低风速组:3,5,6,8;高风速组:10,12,14.1234565. 现有数据:4,6,8,12,14,将其分成两组(每组至少 1 个数据,数据不重复)时,组内离差平方和的最小值为 10,最优分组为{4,6,8}和{12,14}.若在原有数据中添加一个整数 x(x≠4,6,8,12,14,且 x 为 1~25 之间的整数),使得新的 6 个数据按相同分组规则分组后,组内离差平方和的最小值仍为10,则x的值为 13 .13123456解析:原有最优分组验证:第一组{4,6,8}的平均值=(4+6+8)÷3=6,离差平方和=(4-6)2+(6-6)2+(8-6)2=4+0+4=8.第二组{12,14}的平均值=(12+14)÷2=13,离差平方和=(12-13)2+(14-13)2=1+1=2.所以组内离差平方和=8+2=10,符合题目设定.要保持组内离差平方和不变,新增x需融入某组且不增加该组离差平方和,若加入{4,6,8},需满足(x-6)2=0,所以x=6(与原数重合,舍去).若加入{12,14},需满足(x-13)2=0,所以x=13(无重复,符合条件).验证:新分组为{4,6,8}和{12,13,14},第二组的平均值仍为13,离差平方和=1+0+1=2,组内离差平方和仍为10.此题可通过计算机验证其余的分组和不同x的取值.1234566. 在大数据分析中,数据的分组是重要的方法之一.虽然有多种方法可以对数据进行分组,但是使得“组内离差平方和最小”的方法是最传统的,也是最合理的.下表是把1,2,3,4,5这5个数据从小到大排列后进行了分组.分组情况 组内离差 平方和 组间离差 平方和 离差平方和第一组数据 第二组数据1 2,3,4,5 5 5 101,2 3,4,5 a b 101,2,3 4,5 c d 101,2,3,4 5 5 5 10123456(1) 求a,b的值.(1) 因为1= =1.5,2= =4,, =(1-1.5)2+(2-1.5)2=0.5, =(3-4)2+(4-4)2+(5-4)2=2,所以a=0.5+2=2.5.因为 = =3,所以b=2×(1.5-3)2+3×(4-3)2=7.5.123456(2) 直接写出c,d的值.(2) c=2.5,d=7.5.(3) 根据分组的情况,说明如何分组会比较合理.(3) 由分组的情况可知,把5个数据分成{1,2}和{3,4,5}或{1,2,3}和{4,5}两组的组内离差平方和最小,这样的分组会比较合理.123456(共13张PPT)3.3 离差平方和与方差第1课时 离差平方和与方差第3章 数据分析初步01基础进阶02素能攀升目录1. (2025 绍兴嵊州期中)甲、乙、丙三名男生进行跳远测试,这三人10次跳远成绩的平均数都是2.36 m,方差分别是 =1.30 m2, =1.15 m2, =0.85 m2,则这三名男生的跳远成绩中,最稳定的是( C )A. 甲 B. 乙 C. 丙 D. 无法比较C12345672. 学校开展“书香校园,师生共读”活动,某学习小组五名同学一周的课外阅读时间(单位:h)分别为4,5,5,6,10.这组数据的离差平方和是 22 .3. 一组数据按从小到大的顺序排列为1,1,3,x,4,6.若这组数据的中位数为3,则这组数据的标准差是 .22 12345674. ★为了研究甲、乙两种农作物的长势,分别抽取了10株,测得高度(单位:cm)如下.甲:9,10,11,12,7,13,10,8,12,8;乙:8,13,12,11,10,12,7,7,9,11.(1) 试比较两种农作物的平均高度.(1) 因为甲= ×(9+10+11+12+7+13+10+8+12+8)=10(cm),乙= ×(8+13+12+11+10+12+7+7+9+11)=10(cm),所以甲=乙,即两种农作物的平均高度相同.1234567(2) 哪种农作物长得比较整齐?(2) 因为甲=乙=10 cm,= ×[(9-10)2+(10-10)2+(11-10)2+(12-10)2+(7-10)2+(13-10)2+(10-10)2+(8-10)2+(12-10)2+(8-10)2]=3.6(cm2),= ×[(8-10)2+(13-10)2+(12-10)2+(11-10)2+(10-10)2+(12-10)2+(7-10)2+(7-10)2+(9-10)2+(11-10)2]=4.2(cm2),所以 < .所以甲种农作物长得比较整齐.1234567方差在数据分析中的作用 方差是用来描述一组数据中每个数据与这组数据的平均数的偏离程度的量,在实际生活中经常用方差来判断数据的稳定性.方差越大,波动越大,数据越不稳定;方差越小,波动越小,数据越稳定.12345675. 为迎接体育测试,小强每天坚持练习引体向上,他记录了某一周每天练习引体向上的个数,数据如下表:星 期 日 一 二 三 四 五 六个 数 11 12 13 12其中有三天的个数被墨汁覆盖了,但小强已经计算出这组数据的唯一众数是13,平均数是12,则这组数据的离差平方和是 8 .81234567解析:因为这组数据的平均数是12,所以这组数据的和为12×7=84.所以被墨汁覆盖的三天的个数的和为84-(11+12+13+12)=36.因为这组数据的唯一众数是13,所以被墨汁覆盖的三个数为10,13,13.所以这组数据的离差平方和是(11-12)2+(12-12)2+(10-12)2+(13-12)2+(13-12)2+(13-12)2+(12-12)2=8.12345676. 已知一组数据x1,x2,x3,x4,x5的方差是 ,则另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的方差为 3 .解析:设一组数据x1,x2,x3,x4,x5的平均数为 ,则另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3 -2.因为一组数据的方差为S2= [(x1- )2+(x2- )2+…+(x5- )2]= ,所以另一组数据的方差为S′2= [(3x1-2-3 +2)2+(3x2-2-3 +2)2+…+(3x5-2-3 +2)2]= [9(x1- )2+9(x2- )2+…+9(x5- )2]= ×9=3.312345677. 已知A组数据如下:0,1,-2,-1,0,-1,3.(1) 求A组数据的平均数.(1) A= ×(0+1-2-1+0-1+3)=0.1234567(2) 从A组数据中选取5个数据,记这5个数据为B组数据,要求B组数据满足下面两个条件:① 它的平均数与A组数据的平均数相等;②它的方差比A组数据的方差大.你选取的B组数据是什么?请说明理由.1234567(2) 答案不唯一,如选取的B组数据:1,-2,-1,-1,3.理由:由(1)知, A=0,则 = ×[(0-0)2×2+(1-0)2+(-2-0)2+(-1-0)2×2+(3-0)2]= .因为 B= ×(1-2-1-1+3)=0,所以 = ×[(1-0)2+(-2-0)2+(-1-0)2×2+(3-0)2]= .所以 A= B, < .所以选取的B组数据符合题意.1234567(共12张PPT)3.1 平 均 数第1课时 平 均 数第3章 数据分析初步01基础进阶02素能攀升目录1. 在一次青年歌手大赛上,七位评委给某名歌手的评分(单位:分)如下:9.5,9.4,9.6,9.9,9.3,9.7,9.0.去掉一个最高分和一个最低分后,所剩数据的平均数是( D )A. 9.2 B. 9.3 C. 9.4 D. 9.5D1234562. (2024 南充)学校举行篮球技能大赛,评委从控球技能和投球技能两方面为选手打分,各项成绩均按百分制计,然后按控球技能占60%,投球技能占40%计算选手的综合成绩(百分制).选手小林控球技能得90分,投球技能得80分.小林的综合成绩为 86分 .86分1234563. (2025 温州期末)某校举行班容班貌评比活动,以班级为单位,评比项目包括文化卫生、板报宣传和特色栏目.三个班级各项目的得分情况如下表(单位:分):班 级 项 目文化卫生 板报宣传 特色栏目A班 92 88 93B班 94 93 89C班 89 94 96123456(1) 已知A,B两班的平均分分别是91分、92分,通过计算指出哪个班级的平均分最高.(1) C班的平均分为 =93(分).因为91<92<93,所以C班的平均分最高.123456(2) 若将文化卫生、板报宣传和特色栏目的得分按2∶2∶1的比例计算总成绩,此时A,B两班的总成绩分别为90.6分和92.6分,求C班的总成绩,并根据总成绩从高到低给出班级排名.(2) C班的总成绩为 =92.4(分).因为90.6<92.4<92.6,所以B班第1,C班第2,A班第3.1234564. (2025 杭州余杭期末)设甲种糖果的售价为每千克m元,乙种糖果的售价为每千克18元,则3千克甲种糖果和n千克乙种糖果混合而成的什锦糖果的售价为每千克( D )A. 元 B. 元C. 元 D. 元D解析:3千克甲种糖果和n千克乙种糖果混合而成的什锦糖果的售价为每千克 元.1234565. 在数据4,5,6,5中去掉n个数据.若平均数(至少有2个数据)没有发生变化,则n的值是 1或2 .解析:因为 = ×(4+5+6+5)= ×20=5,所以在数据4,5,6,5中去掉n个数据,当平均数没有发生变化时,被去掉的这n个数据的和为5n.所以若去掉1个数据,则这个数据为5×1=5;若去掉2个数据,则这2个数据的和为5×2=10,即可以去掉数据5,5或者4,6;若去掉3个数据,则还剩1个数据,不符合题意.综上所述,符合题意的n的值是1或2.1或21234566. 某单位招聘员工,采取笔试与面试相结合的方式进行考核,两项成绩的满分均为100分.前3名选手的得分如下表:序 号 1 2 3笔试成绩/分 90 92 84面试成绩/分 85 88 86根据规定,笔试成绩和面试成绩分别按一定的百分比折合成综合成绩(综合成绩的满分仍为100分),现得知1号选手的综合成绩为87分.123456(1) 求笔试成绩和面试成绩各占的百分比.(1) 设笔试成绩的占比为x,则面试成绩的占比为(1-x).根据题意,得90x+85(1-x)=87,解得x=0.4=40%.所以1-x=60%.答:笔试成绩占40%,面试成绩占60%.123456(2) 求出其余两名选手的综合成绩,并以综合成绩排序确定这三名选手的名次.(2) 2号选手的综合成绩为92×40%+88×60%=89.6(分),3号选手的综合成绩为84×40%+86×60%=85.2(分).因为89.6>87>85.2,所以根据综合成绩排名,第一名是2号选手,第二名是1号选手,第三名是3号选手.123456(共23张PPT)3.2 中位数与众数第3章 数据分析初步01基础进阶02素能攀升03思维拓展目录1. (2024 湖南)某班的5名同学1分钟跳绳的成绩(单位:次)分别为179,130,192,158,141.这组数据的中位数是( B )A. 130 B. 158 C. 160 D. 192B12345678910112. (2025 南充)在一次体质健康检测中,某班体育委员对该班20名男生在一分钟内“引体向上”的个数进行了统计,并制作成如下的统计表:个 数 6 9 11 12 15人 数 2 5 8 3 2这20名男生在一分钟内“引体向上”的个数的众数是( C )A. 6 B. 9 C. 11 D. 15C12345678910113. 某校举办成语听写大赛,15名学生进入决赛,决赛中他们所得分数互不相同.比赛共设8个获奖名额,某学生知道自己的分数后,要判断自己能否获奖,他应该关注的统计量是 中位数 (填“平均数”“众数”或“中位数”).中位数12345678910114. 如图所示为根据某班40名同学一周的体育锻炼情况绘制的条形统计图,那么该班40名同学一周参加体育锻炼时间的中位数是 9 h,众数是 8 h.(第4题)9812345678910115. 八年级一班30名同学参加运动线上打卡,张老师为了鼓励同学们积极锻炼,统计了这30名同学某段时间的打卡次数,制成如下统计表:打卡次数 7 8 9 14 15人 数 6 9 6 3 6(1) 打卡次数的众数为 8 ,中位数为 8.5 . (2) 求所有同学打卡次数的平均数.(2) 所有同学打卡次数的平均数为(7×6+8×9+9×6+14×3+15×6)÷30=10.88.51234567891011(3) 为了调动同学们锻炼的积极性,张老师决定制订一个打卡奖励标准,凡打卡次数达到或超过这个标准的同学将获得奖励.请你根据(1)和(2)中所求的统计量,帮助张老师制订一个较为合理的打卡奖励标准,并说明理由.(3) 打卡不少于9次的同学获得奖励.理由:为了调动同学们锻炼的积极性,打卡奖励标准可以定为所有同学打卡次数的中位数.因为共有30人,打卡9次以上(含9次)的有15人,等于总人数的一半,所以打卡不少于9次的同学获得奖励(言之有理即可).12345678910116. 在一次体检中,甲、乙、丙、丁四名同学的平均身高为1.65 m,而甲、乙、丙三名同学的平均身高为1.63 m,下列说法中,一定正确的是( C )A. 四名同学身高的中位数一定是其中一名同学的身高B. 丁同学的身高一定高于其他三名同学的身高C. 丁同学的身高为1.71 mD. 四名同学身高的众数一定是1.65 mC1234567891011解析:对于A选项,四名同学身高的中位数是某两名同学身高的平均数,而这个平均数不一定是其中一名同学的身高.故A错误.对于B选项,丁同学的身高不一定高于其他三名同学的身高.故B错误.对于C选项,丁同学的身高为1.65×4-1.63×3=1.71(m).故C正确.对于D选项,四名同学身高的众数不一定是1.65 m.故D错误.12345678910117. 如图所示为小颖前三次购买苹果价格的统计图.若她第四次购买苹果的价格是a元/千克,发现这四个价格的中位数恰好也是众数,则a的值为( B )A. 9 B. 8 C. 7 D. 6(第7题)B1234567891011解析:当a=9时,四个价格的中位数是 =8.5(元/千克),众数是9元/千克.故A错误.当a=8时,四个价格的中位数是 =8(元/千克),众数是8元/千克.故B正确.当a=7时,四个价格的中位数是=7.5(元/千克),没有众数.故C错误.当a=6时,四个价格的中位数是 =7(元/千克),众数是6元/千克.故D错误.12345678910118. ★若从小到大排列的一组数据-1,1,2,x,6,8的中位数为2,则这组数据的众数和平均数分别是( B )A. 2,4 B. 2,3 C. 1,4 D. 1,3解析:因为从小到大排列的一组数据-1,1,2,x,6,8的中位数为2,所以 =2,解得x=2.因为2出现的次数最多,所以这组数据的众数是2.因为这组数据为-1,1,2,2,6,8,所以这组数据的平均数是(-1+1+2+2+6+8)÷6=3.B1234567891011根据中位数的意义求值 已知中位数求未知数的值时,一般先把已知数据排序(本题中已经说明这组数据从小到大排列),再根据题中中位数的值确定未知数的位置(有时需要分类讨论),最后根据中位数的概念求出未知数的值.该组数据确定后,众数和平均数不难得出.12345678910119. 将5个整数从小到大排列,其中位数是4,且唯一的众数是6,则这5个整数的和最大可能是 21 .解析:设这5个整数从小到大排列为x1,x2,x3,x4,x5.由题意,得x3=4.因为唯一的众数是6,所以这5个整数的和最大的情况为2,3,4,6,6.因为2+3+4+6+6=21,所以这5个整数的和最大可能是21.21123456789101110. 有甲、乙两个箱子,其中甲箱内有98个球,分别标记号码1~98,且号码为不重复的整数,乙箱内没有球.已知小育从甲箱内拿出48个球放入乙箱后,乙箱内球的号码的中位数为40.若此时甲箱内有a个球的号码小于40,有b个球的号码大于40.(1) 求a,b的值.1234567891011(1) 根据题意,得甲箱内还剩98-48=50(个)球.因为乙箱内球的号码的中位数为40,所以乙箱内号码小于40、大于40的球各有48÷2=24(个),且40号球不在其中.所以甲箱内球的号码小于40的球有39-24=15(个),号码大于40的球有50-1-15=34(个).所以a=15,b=34.1234567891011(2) 判断此时甲箱内球的号码的中位数能否为40,并说明理由.(2) 甲箱内球的号码的中位数不能为40.理由:因为a=15,b=34,所以甲箱内处于中间的两个球的号码均大于40,即甲箱内球的号码的中位数不能为40.123456789101111. 某公司有A,B,C三种型号的电动汽车出租,每辆车每天的费用分别为300元、380元、500元.阳阳打算从该公司租一辆电动汽车外出旅游一天,往返行程为210 km,他为了选择合适的型号,通过网络调查,获得了A,B,C三种型号的电动汽车充满电后的行驶里程的统计图如图所示.(第11题)1234567891011(1) 阳阳对B,C两种型号的电动汽车的行驶里程的平均数、中位数、众数统计如下表:型 号 平均数/km 中位数/km 众数/kmB 216 215 220C 227.5 227.5 225请继续求出A型号电动汽车的行驶里程的平均数、众数和中位数.1234567891011(1) 由题图,得A型号电动汽车的行驶里程的平均数为=200(km);众数为205 km;中位数为 =200(km).1234567891011(2) 为了尽可能避免行程中充电耽误时间,又能经济实惠地用车,请你从费用和能否符合行程要求等角度进行分析,给出合理的用车型号建议.1234567891011(2) 建议选择B型号电动汽车.因为A型号电动汽车行驶里程的平均数、中位数和众数均低于210 km,且只有10%的车辆能达到行程要求,所以不建议选择A型号电动汽车.因为B,C两种型号的电动汽车行驶里程的平均数、中位数和众数都超过210 km,很大程度上可以避免行程中充电耽误时间,且B型号电动汽车比C型号电动汽车更经济实惠,所以建议选择B型号电动汽车.1234567891011(共11张PPT)3.4 四分位数与箱线图第2课时 箱 线 图第3章 数据分析初步01基础进阶02素能攀升目录1. 一组数据的箱线图如图所示,根据箱线图判断,下列说法中错误的是( C )A. 这组数据的最大值是 180B. 这组数据的最小值是 50C. m50=100D. m75=150(第1题)C123452. 如图所示为甲、乙两地在某一个月中日平均气温的箱线图,从中可以发现这个月的日平均气温波动较大的是 甲地 (填“甲地”或“乙地”).(第2题)甲地123453. 某地有8个快递收件点,在某天接收到的快递个数分别为360,284,290,300,188,240,260,288.(1) 求这组数据的四分位数.(1) 将数据从小到大排列为188,240,260,284,288,290,300,360.这组数据共有8个数,第4、第5个数的平均数即为中位数,所以m50= =286.中位数左右两边各有4个数,它们的中位数分别是所有数据中的第2、第3个数的平均数和第6、第7个数的平均数,所以m25= =250,m75= =295.12345(2) 画出箱线图.(2) 箱线图如图所示.(第3题)(第3题)123454. 已知八年级一班和二班的人数相等,在一次考试中,两个班成绩的箱线图如图所示,则下列说法中,正确的是( D )DA. 一班成绩比二班成绩集中B. 一班成绩的第75百分位数是80分C. 一班同学的成绩有超过140分的D. 一班和二班成绩的中位数相同解析:二班的箱线图的“须”更短,说明二班成绩比一班成绩集中.故A错误.一班成绩的第25百分位数是80分.故B错误.一班同学的成绩没有超过140分的.故C错误.一班和二班成绩的中位数都是100分.故D正确.123455. 有A,B两个跳远小组,每组12人.在某次跳远测试中,成绩(单位:m)统计如下:A组:4.77,3.98,6.44,4.89,2.15,3.85,3.64,3.21,3.18,2.02,4.11,4.10.B组:3.18,3.84,3.99,3.67,3.40,3.60,4.10,4.21,4.15,4.44,3.87,3.91.(1) 求这两组跳远成绩的四分位数,并绘制箱线图.12345(1) 将A组成绩(单位:m)按从小到大的顺序排列:2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44.将B组成绩(单位:m)按从小到大的顺序排列:3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.44.A组跳远成绩共有12个数,第6个数和第7个数的平均数即中位数,所以m50= =3.915(m).12345中位数左右两边各有6个数,它们的中位数分别是第3、第4个数的平均数和第9、第10个数的平均数,所以m25= =3.195(m),m75= =4.44(m).同理,可得B组跳远成绩的四分位数分别为m25= =3.635(m),m50==3.89(m),m75= =4.125(m).箱线图如图所示.(第5题)12345(2) 根据(1)中绘制的箱线图,请比较A,B两组跳远的成绩,若要从中选一组参加比赛,你有何看法?(2) 分析箱线图,可以直观地看出A组与B组的中位数几乎相等,但从两组的长方形“箱子”大小情况看,A组成绩明显比B组成绩波动大,如果选一组参加比赛,那么选择B组,发挥会比较稳定,但是如果想要打破纪录,那么可以选择A组参加(合理即可).12345(共12张PPT)3.1 平 均 数第2课时 分布式计算第3章 数据分析初步01基础进阶02素能攀升目录1. 某中学举办科学实验技能竞赛,八、九两个年级的学生参加,平均成绩分别为85分、80分.若八、九年级参加这次竞赛的学生人数之比为4∶3,则所有参赛学生的平均成绩约为( B )A. 82.5分 B. 82.9分C. 83.2分 D. 83.5分B1234562. 一餐饮集团有A,B,C三家门店,某天的消费记录显示,A店有a名顾客,电子支付占75%;B店有b名顾客,电子支付占60%;C店有c名顾客,电子支付占80%. 若a∶b∶c=1∶2∶3,则该餐饮集团这一天的顾客中,电子支付所占的百分比是 72.5% .72.5%1234563. 某社区调查了居民一周的户外散步时间,三个小区的人数与人均散步时间如下表:小 区 甲小区 乙小区 丙小区居民人数 200 300 250人均散步时间/小时 5.2 4.8 5.5该社区居民这一周人均户外散步时间的平均数为 5.14 小时.5.141234564. 某餐饮品牌有甲、乙两家门店,每家门店有堂食和外卖两种消费方式,相关数据如下表:门 店 甲门店 乙门店堂食人数 400 500堂食人均消费/元 40 50外卖订单数 300 200外卖人均消费/元 25 30求该餐饮品牌所有顾客的人均消费金额(精确到0.01元).123456甲门店总消费:400×40+300×25=16 000+7 500=23 500(元).乙门店总消费:500×50+200×30=25 000+6 000=31 000(元).总消费金额:23 500+31 000=54 500(元).总顾客数:400+300+500+200=1 400(人).所以人均消费金额为54 500÷1 400≈38.93(元).1234565. 某教育集团旗下有A,B,C三所学校,2025年各校学生总人数如下表所示. 该教育集团进行了数学竞赛,竞赛满分为150分,A校参赛学生占本校总人数的70%,平均分为120分;B校参赛学生占本校总人数的65%,平均分为115分;C校参赛学生占本校总人数的80%,平均分为125分.求该教育集团参赛学生的数学竞赛的平均分(精确到0.1分).学 校 A校 B校 C校学生总人数 2 000 2 500 1 800123456A校参赛人数为2 000×70%=1 400, B校参赛人数为2 500×65%=1 625,C校参赛人数为1 800×80%=1 440.所以该教育集团参赛学生的数学竞赛的平均分为≈119.8(分).1234566. 某音乐平台举办“年度金曲”评选活动,A,B,C三首歌曲在甲、乙、丙、丁四地的投票情况如下表.如果总得票率超过85%的歌曲会被评为“年度金曲”,那么这三首歌曲中,有被评为“年度金曲”的吗?若有,是哪一首?地 区 投票人数 得票率歌曲A 歌曲B 歌曲C甲地 12 000 82% 78% 88%乙地 18 000 86% 80% 90%丙地 20 000 84% 85% 82%丁地 15 000 88% 90% 86%123456歌曲A获得的总票数为12 000×82%+18 000×86%+20 000×84%+15 000×88%=55 320;歌曲B获得的总票数为12 000×78%+18 000×80%+20 000×85%+15 000×90%=54 260;歌曲C获得的总票数为12 000×88%+18 000×90%+20 000×82%+15 000×86%=56 060;总投票人数为12 000+18 000+20 000+15 000=65 000.歌曲A的得票率= ×100%≈85.1%;123456歌曲B的得票率= ×100%≈83.5%;歌曲C的得票率= ×100%≈86.2%.因为歌曲A的得票率≈85.1%,歌曲C的得票率≈86.2%,均超过85%,所以歌曲A和歌曲C被评为“年度金曲”.123456(共13张PPT)3.4 四分位数与箱线图第1课时 四分位数第3章 数据分析初步01基础进阶02素能攀升目录1. 已知样本数据10,11,9,13,10,9,12,12,则这组样本数据的第75百分位数是( D )A. 9 B. 10 C. 11 D. 12D12345672. 在一次数学测验中,某小组的7名同学的成绩(单位:分)分别为109,116,122,126,131,134,140,则这7名同学成绩的第75百分位数与第25百分位数的差为 18 分.1812345673. 某市 12 月16日至12月31日每天的最高气温(单位:℃)依次如下:5,3,2,2,2,2,3,3,5,5,-2,-2,-5,-1,-1,-1.求这组数据的四分位数 m25,m50,m75.将这 16 个数据由小到大排序:-5,-2,-2,-1,-1,-1,2,2,2,2,3,3,3,5,5,5.第8个数和第9个数的平均数即为中位数,所以m50= =2(℃).中位数两边各有8个数,它们的中位数分别是所有数据中的第4、第5个数据的平均数和第12、第13个数据的平均数,所以m25= =-1(℃);m75= =3(℃).12345674. 某健身俱乐部统计了200名会员一个月内的健身次数,该组健身次数数据的第25百分位数为10,第75百分位数为18.(1) 估计健身次数在 10~18之间的会员人数.(1) 健身次数在10~18之间的会员占比约为50%,所以估计健身次数在10~18之间的会员人数为200×50%=100.(2) 俱乐部为了激励会员多健身,决定对健身次数超过或等于上四分位数的会员给予奖励.若准备 10 份奖励,是否足够?(2) 健身次数超过或等于18次的会员至少占25%,200×25%=50(人),所以准备10份奖励不够.12345675. 某考生参加某高校的综合评价招生,并成功通过了初试,在面试阶段中,8位老师根据考生表现给出得分,得分(单位:分)由低到高依次为76,a,b,80,80,81,84,85.若这组数据的第25百分位数为77,则这组数据的平均数为( B )A. 79 B. 80 C. 81 D. 82B1234567解析:这组数据由小到大依次为76,a,b,80,80,81,84,85.这组数据共有8个,第25百分位数为第2、第3个数据的平均数,为77,则(a+b)÷2=77,所以a+b=154.所以该组数据的平均数为(76+a+b+80+80+81+84+85)÷8=(a+b+486)÷8=(154+486)÷8=80.12345676. 下表是校篮球队某队员若干场比赛的得分.每场比赛得分/分 3 6 7 10 11 13 30频 数 2 1 2 3 1 1 1则这组得分数据的四分位数依次为 6,10,11 . 解析:将这组数据按从小到大的顺序排列如下:3,3,6,7,7,10,10,10,11,13,30,共11个数据.第6个数即中位数,所以m50=10.中位数左右两边各有5个数,它们的中位数分别是所有数据中的第3个数和第9个数,所以m25=6,m75=11. 6,10,1112345677. 某超市随机抽取 30 天的日销售额(单位:元)如下:5 200,4 800,6 100,5 500,4 900,5 800,5 300,4 700,6 000,5 100,5 600,4 600,5 900,5 400,4 500,5 700,5 200,4 800,5 000,5 300,5 500,4 700,5 800,5 100,4 900,5 600,5 400,4 800,5 700,5 900.1234567(1) 求这组数据的四分位数.(1) 将 30 个数据从小到大排序为4 500,4 600,4 700,4 700,4 800,4 800,4 800,4 900,4 900,5 000,5 100,5 100,5 200,5 200,5 300,5 300,5 400,5 400,5 500,5 500,5 600,5 600,5 700,5 700,5 800,5 800,5 900,5 900,6 000,6 100.1234567因为这组数据共有30个,中位数是第15个和第16个数据的平均数,所以m50= =5 300(元).中位数左右两边各有15个数据,它们的中位数分别是所有数据中的第8个数和第23个数,所以m25=4 900元,m75=5 700元.1234567(2) 根据所求得的四分位数,分析该超市日销售额的分布情况.(2) 销售额分布分析:m25=4 900元,说明至少有25%的天数日销售额低于或等于4 900元;m50=5 300元,说明至少有50%的天数日销售额低于或等于5 300元;m75=5 700元,说明至少有25%的天数日销售额不低于5 700元.整体来看,该超市日销售额集中在4 900~5 700元,中位数5 300元反映了日销售额的中间水平,销售额分布相对均匀,高销售额(5 700元及以上)和低销售额(4 900元以下)的天数占比均约为25%.1234567(共38张PPT)第3章整合拔尖第3章 数据分析初步01知识体系构建02高频考点突破目录03综合素能提升考点一 平均数、中位数和众数的计算典例1 物理兴趣小组的同学在实验操作中的得分情况如图所示.(1) 这个物理兴趣小组的实验操作得分的平均数是多少?(典例1图)(1) 因为15%+20%+40%+25%=1,所以平均数为7×15%+8×20%+9×40%+10×25%=8.75(分).(2) 求这个物理兴趣小组的实验操作得分的众数.(2) 因为40%>25%>20%>15%,所以这个物理兴趣小组的实验操作得分的众数为9分.(3) 求这个物理兴趣小组的实验操作得分的中位数.(3) 由扇形统计图知,得7分的同学占了15%,得8分的同学占了20%,得9分的同学占了40%,得10分的同学占了25%,15%+20%=35%<50%,15%+20%+40%=75%>50%,所以这个物理兴趣小组的实验操作得分的中位数是9分. (1) 由扇形统计图可知各得分对应的百分比,再利用加权平均数公式即可求解.(2) 众数指出现次数最多的数,因此众数占总数的百分比也最大,故只要找出所占百分比最大的那个数据即可.(3) 中位数是处于一组数据中间位置的数,只要借助扇形统计图中的百分比确定其位于哪一部分即可.[变式] 某校某班为了确定每名学生每天所能完成的数学作业的题量,老师随机抽查了该班9名学生在某一天中各自完成数学作业的题量(单位:道),具体如下:7,8,8,9,10,12,14,17,19.根据抽样的数据,老师将每名学生的标准做题量定为10道,其依据是统计数据中的( C )A. 最大值 B. 众数C. 中位数 D. 平均数C解析:这组数据的中位数是10,众数是8,平均数是≈11.56,最大值是19,因此将每名学生的标准做题量定为10道,其依据是统计数据中的中位数.考点二 描述数据的集中趋势典例2 ★为了全面了解学生的学习、生活及家庭的基本情况,加强学校、家庭的联系,某中学积极组织全体教师开展课外访万家活动.王老师对所在班级的全体学生进行了实地家访,了解到每名学生家庭的相关信息,现从中随机抽取15名学生的家庭年收入情况,统计如下表:年收入/万元 6 6.5 7 8 9 13 17家庭户数 1 3 5 2 2 1 1(1) 求这15名学生的家庭年收入的平均数、中位数、众数.(1) 这15名学生的家庭年收入的平均数是(6+6.5×3+7×5+8×2+9×2+13+17)÷15=8.3(万元).因为将这15个数据从小到大排列,最中间的数据是7,所以这15名学生的家庭年收入的中位数是7万元.因为在这一组数据中出现次数最多的是7,所以这15名学生的家庭年收入的众数是7万元.(2) 你认为用(1)中的哪个数据来代表这15名学生的家庭年收入的一般水平较为合适?请简要说明理由.(2) 答案不唯一,如用众数代表这15名学生的家庭年收入的一般水平较为合适.理由:在这15个数据中,7出现的次数最多,所以能代表这15名学生的家庭年收入的一般水平.选择合适的统计量表示一组数据集中趋势的方法 我们不仅要会求平均数、中位数和众数,还要能正确地选用平均数、中位数、众数表示一组数据的集中趋势.当一组数据中某些数据重复出现时,众数往往作为首选的统计量;当个别数据偏差较大时,常用中位数反映该组数据的集中趋势.选择的统计量要能代表这组数据全部或绝大部分的特征. (1) 根据平均数、中位数和众数的定义求解即可.(2) 由于平均数受到极端值的影响较大,且众数、中位数更能反映较多家庭年收入的一般水平,因此在众数、中位数中选择一个即可.[变式] (2025 扬州)为角逐市校园“音乐达人”大赛,小红和小丽参加了校内选拔赛,10位评委的评分情况如下.表1 评委评分数据选手 评委评分/分小红 7 8 7 8 7 7 7 8 7 9小丽 7 7 6 8 8 8 8 8 7 8表2 评委评分数据分析选手 平均数/分 中位数/分 众数/分小红 7.5 b 7小丽 a 8 c根据以上信息,回答下列问题:(1) 表2中a= 7.5 ,b= 7 ,c= 8 . 选 手 平均数/分 中位数/分 众数/分小红 7.5 b 7小丽 a 8 c解析:由题意,得a= =7.5,b= =7,c=8.7.578(2) 你认为小红和小丽谁的成绩较好?请说明理由.选 手 平均数/分 中位数/分 众数/分小红 7.5 b 7小丽 a 8 c(2) 小丽的成绩较好.理由:因为两个人成绩的平均数相同,但小丽成绩的中位数和众数均高于小红,所以小丽的成绩较好(言之有理即可).考点三 方差的计算与应用典例3 如图所示为某市5月连续5天的天气情况.(典例3图)(1) 利用方差判断该市这5天是日最高气温的波动大,还是日最低气温的波动大.(1) 这5天的日最高气温和日最低气温的平均数分别是高= ×(23+25+23+25+24)=24(℃),低= ×(21+22+15+15+17)=18(℃);方差分别是 = ×[(23-24)2+(25-24)2+(23-24)2+(25-24)2+(24-24)2]=0.8(℃2), = ×[(21-18)2+(22-18)2+(15-18)2+(15-18)2+(17-18)2]=8.8(℃2). 因为0.8<8.8,即 < ,所以该市这5天的日最低气温波动大.(2) 根据图中提供的信息,请再写出两个不同类型的结论.(2) 答案不唯一,如① 5月25日、26日、27日的天气依次为大雨、中雨、晴,空气质量依次为良、优、优,说明下雨后空气质量改善了.② 5月27日、28日、29日的天气依次是晴、晴、多云,最低气温分别为15 ℃、15 ℃、17 ℃,说明晴天的最低气温低. (1) 先根据平均数与方差公式进行计算,再根据方差的意义判断即可.(2) 答案不唯一,可从空气质量及其变化进行说明.[变式] 对甲、乙两种不同型号的越野吉普车各10辆进行刹车系统性能测试,两种越野吉普车的制动距离(单位:m)如下表:甲 69 81 78 77 72 78 79 74 77 75乙 78 76 76 80 77 72 82 80 72 67(1) 甲、乙两种型号的越野吉普车的制动距离的方差分别是 11.4 m2, 18.6 m2. 11.418.6(2) 哪种型号的越野吉普车刹车系统性能比较稳定?为什么?(2) 甲种型号.因为通过计算可知两种型号的越野吉普车的制动距离的平均数相等,均为76 m,而甲种型号的方差为11.4 m2,乙种型号的方差为18.6 m2,18.6>11.4,所以甲种型号的越野吉普车刹车系统性能比较稳定.考点四 四分位数与箱线图典例4 甲、乙两组的测试成绩(单位:分)如下:甲:91,96,70,89,60,70,100,80,92,98;乙:92,93,70,88,82,75,96,80,92,95.(1) 求甲组数据的四分位数m25,m50,m75.(1) 将甲组成绩数据从小到大排列为 60,70,70,80,89,91,92,96,98,100,共10个数据,第5、第6个数的平均数为中位数,所以m50= =90.中位数左右两边各有5个数据,它们的中位数分别是所有数据中的第3个数和第8个数,所以m25=70,m75=96.(2) 根据四分位数可绘制出如图所示的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图.(典例4图)(2) 如图所示.(典例4图)(3) 根据箱线图和对四分位数的理解,谈谈你对两组成绩的看法.(3) 根据箱线图和四分位数可知,甲组成绩的中位数和乙组相同,但甲组成绩明显比乙组成绩的波动大.[变式] 一组数据的箱线图中,若下半截箱子明显比上半截箱子短,说明该组数据( A )A. 大部分数据集中在较小值一端B. 大部分数据集中在较大值一端C. 数据分布均匀D. 存在较多异常值A1. 为了解“睡眠管理”落实情况,某初中学校随机调查了50名学生平均每天的睡眠时间(时间均保留整数),将样本数据绘制成如图所示的统计图,其中有两个数据被遮盖了.关于睡眠时间的统计量中,与被遮盖的数据无关的是( B )A. 平均数 B. 中位数C. 众数 D. 方差(第1题)B1234解析:由题图可知,平均数、众数、方差都无法计算,中位数是(9+9)÷2=9(h).2. 现有 5 个数据:3,5,7,11,13.将其分成两组(每组至少 1 个数据,数据不重复,两组数量可任意分配),则组内离差平方和的最小值为( B )A. 8 B. 10C. 12 D. 14B1234解析:将5个数据从小到大排列为3,5,7,11,13.分组情况如下表:第1组 第2组 +3 5,7,11,13 403,5 7,11,133,5,7 11,13 103,5,7,11 13 35由表可知,组内离差平方和的最小值为10.12343. 某机床生产一种零件,在6月6日至9日这4天中出现次品的数量如下表:日 期 6月6日 6月7日 6月8日 6月9日次品数量/个 1 0 2 a若出现次品数量的唯一众数为1个,则数据1,0,2,a的方差为 . 解析:因为出现次品数量的唯一众数为1个,所以a=1.所以数据1,0,2,1的平均数 = ×(1+0+2+1)=1.所以数据1,0,2,1的方差为 ×[(1-1)2+(0-1)2+(2-1)2+(1-1)2]= .12344. 八年级一班准备从甲、乙两名男生中选派一名参加学校组织的一分钟跳绳比赛,在相同的条件下,分别对两名男生进行了8次一分钟跳绳测试.现将测试结果绘制成如图所示的统计图和如下不完整的统计表:平均 数/个 中位 数/个 众数/个 方差/个2甲 175 a b 93.75乙 175 175 170,175,180 c(第4题)1234(1) 求a,b的值.(1) 甲的成绩(单位:个)按从小到大的顺序排列为160,165,165,175,180,185,185,185,所以甲的成绩的中位数为(175+180)÷2=177.5(个).因为185出现了3次,出现的次数最多,所以众数是185个.所以a=177.5,b=185.1234(2) 若从八年级一班选一名成绩稳定的选手参赛,你认为应选谁?请说明理由.1234(2) 应选乙.理由: = ×[2×(175-175)2+2×(180-175)2+2×(170-175)2+(185-175)2+(165-175)2]=37.5(个2).因为37.5<93.75,即乙的成绩的方差小于甲的成绩的方差,所以乙的成绩比甲的成绩稳定,即应选乙.1234(3) 根据上述分析,请你运用所学的统计知识,任选两个角度评价甲、乙两名男生一分钟跳绳成绩谁更优.(3) 答案不唯一,如从平均数和方差相结合看,甲、乙的成绩的平均数相等,乙的成绩的方差小于甲的成绩的方差,所以乙的成绩比甲的成绩稳定.所以乙的成绩更优.1234(共18张PPT)专题特训五 数据分析的实际应用第3章 数据分析初步类型一 用平均数进行决策1. (2025 宁波余姚期末)某校广播台要招聘一名编辑,甲、乙、丙三名同学报名参加了三项素质测试,各项得分如下表(单位:分):语言文字能力 运用媒体能力 创意设计能力甲 86 77 77乙 84 89 73丙 80 78 8512345(1) 计算得甲、乙的平均分分别为80分,82分,请求出丙的平均分,并根据三人的平均分从高到低进行排序.(1) 丙的平均分= =81(分).因为82>81>80,所以根据三人的平均分从高到低排列为乙、丙、甲.12345(2) 如果学校认为这三项的重要程度有所不同,每名应聘者的语言文字能力、运用媒体能力、创意设计能力的成绩应按5∶2∶3的比例计算最终成绩,并且每名应聘者的单项得分最低不能低于75分.问:谁能成功应聘?(2) 因为乙的创意设计能力的得分低于75分,所以乙首先被淘汰.又因为甲的最终成绩是 =81.5(分),丙的最终成绩是 =81.1(分),且81.5>81.1,所以甲能成功应聘.12345类型二 用中位数、众数进行决策2. 为了解学生的体育锻炼情况,学校以“活跃校园——探索初中生的运动生活”为主题开展调查研究.通过问卷,调查研究小组收集了八、九年级学生的平均每周锻炼时长数据,现从这两个年级中分别随机抽取10名学生的平均每周锻炼时长(单位:小时)进行统计.八年级:9,8,11,8,7,5,6,8,6,12.九年级:9,7,6,9,9,10,8,9,7,6.整理如下表:年 级 平均数/小时 中位数/小时 众数/小时八年级 8 a 8九年级 8 8.5 b12345根据以上信息,回答下列问题:(1) 填空:a= 8 ,b= 9 .解析:将八年级随机抽取的10名学生的平均每周锻炼时长(单位:小时)由小到大排列为5,6,6,7,8,8,8,9,11,12,所以a==8.九年级随机抽取10名学生的平均每周锻炼时长(单位:小时)中,9出现的次数最多,所以b=9.8912345(2) 甲同学说:“我平均每周锻炼8.2小时,位于年级中等偏上水平.”由此可判断他是 八 年级的学生.解析:因为平均每周锻炼8.2小时,位于年级中等偏上水平,且8<8.2<8.5,所以他是八年级的学生.八12345(3) 你认为哪个年级的学生体育锻炼情况的总体水平较好?请给出一条理由.(3) 我认为九年级的学生体育锻炼情况的总体水平较好.理由:在平均数相同的情况下,九年级学生平均每周锻炼时长的中位数高于八年级(合理即可).12345类型三 用方差进行决策3. (2025 泸州)某校七年级甲、乙、丙、丁四名同学参加1分钟跳绳测试,每人10次跳绳成绩的平均数(单位:个)及方差(单位:个2)如下表:甲 乙 丙 丁平均数 205 217 208 217方 差 4.6 4.6 6.9 9.6根据表中数据,要从中选择一名成绩好且发挥稳定的同学参加比赛,应选择( B )A. 甲 B. 乙 C. 丙 D. 丁B12345解析:由表知,乙、丁跳绳成绩的平均数大于甲、丙,所以乙、丁两名同学的成绩更好.又因为乙跳绳成绩的方差小于丁,所以乙同学成绩好且发挥稳定.123454. A,B两家农副产品加工厂到某公司推销鸡腿,两家加工厂的鸡腿价格相同,品质相近.该公司决定通过检查质量来确定选购哪家加工厂的鸡腿,检查人员从两家分别抽取100个鸡腿,再从中随机各抽取10个,记录它们的质量(单位:克)如下表:A加工厂 74 75 75 75 73 77 78 72 76 75B加工厂 78 74 78 73 74 75 74 74 75 75(1) 根据表中数据,求A加工厂的10个鸡腿质量的平均数、中位数和众数.12345(1) A加工厂的10个鸡腿质量的平均数 A= ×(74+75+75+75+73+77+78+72+76+75)=75(克).把题表中A加工厂的10个鸡腿质量的数据从小到大排列,中位数是第5、第6个数据的平均数,即(75+75)÷2=75(克).因为75出现了4次,出现的次数最多,所以众数是75克.12345(2) 根据鸡腿质量的稳定性,该公司应选购哪家加工厂的鸡腿?(2) = ×[(74-75)2+4×(75-75)2+(76-75)2+(73-75)2+(72-75)2+(77-75)2+(78-75)2]=2.8(克2);B= ×(78+74+78+73+74+75+74+74+75+75)=75(克),= ×[2×(78-75)2+4×(74-75)2+(73-75)2+3×(75-75)2]=2.6(克2).因为 A= B, > ,所以B加工厂的鸡腿质量更稳定.所以该公司应选购B加工厂的鸡腿.12345类型四 用四分位数及箱线图分析数据5. 某年级开展专项安全教育活动,在全校范围内随机抽取了40名学生进行安全知识测试,测试结果如图所示(每道题1分,共10道题),设定8分及以上为合格,分析结果得到下表.(第5题)统计量 平均数 众数 下四 分位数 中位数 上四分位数得分/分12345请根据图表中的信息,解答下列问题:(1) 将表中数据补充完整.(1) 填表如下:统计量 平均数 众数 下四分位数 中位数 上四分位数得分/分 8.55 8 8 9 912345(2) 作出这组数据的箱线图.(2) 如图所示.(第5题)(第5题)12345(3) 若全校有1 200名学生,估计安全知识测试达到合格水平的学生人数.(3) ×1 200=1 050(名).答:估计安全知识测试达到合格水平的学生人数为1 050.12345(4) 在条形统计图中,数据的分布有什么特点?你作出的箱线图是否也反映了数据的这种特征?(4) 条形统计图的数据准确,数据分布能体现数据的集中趋势,箱线图也可以反映数据的集中趋势.12345 展开更多...... 收起↑ 资源列表 3.2 中位数与众数.pptx 第3章整合拔尖.pptx 第1课时 平?均?数.pptx 第2课时 分布式计算.pptx 第1课时 离差平方和与方差.pptx 第2课时 数据的分组.pptx 专题特训五 数据分析的实际应用.pptx 第1课时 四分位数.pptx 第2课时 箱?线?图.pptx