资源简介 (共68张PPT)第三章 统计数据的整理与显示学习目标 知识目标 了解统计数据整理与显示的基本内容;掌握选择分组标志、编制变量数列、制作基本统计图表的技术和方法。 能力目标 能够运用统计分组理论和频数分布技术,依据客观事物数据进行基本统计描述和分析。第三章 统计数据的整理与显示第一节 统计数据整理概述第二节 统计数据分组第三节 频数分布第四节 统计数据的显示第五节 EXCEL在统计数据整理和显示中的应用第三章 统计数据的整理与显示第一节 统计数据整理概述一、数据整理及其类型二、数据整理的原则和内容三、数据的预处理第三章 统计数据的整理与显示 一、数据整理概念和内容 统计数据整理就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。它是统计由对个别现象的认识上升到对总体现象认识的重要阶段,在统计研究工作中起着承前启后的作用,它既是数据搜集的继续和深化,又是数据分析的基础和前提。其类型主要有定期统计报表数据整理、专题性数据整理和历史数据整理等。 统计数据整理必须遵循目的性、联系性和简明性三原则。 统计数据整理的内容一般有五个方面:第一,确定指标分组;第二,对原始数据进行预处理;第三,计算出各组单位数、总体单位数以及各组或总体的有关标志值之和;第四,编制统计表;第五,对统计数据进行系统积累。 数据的预处理主要是对数据进行筛选审核、订正和排序。第三章 统计数据的整理与显示第二节 统计数据分组一、统计数据分组的意义二、统计数据分组的类型三、统计数据分组的方法四、统计资料的再分组五、国民经济统计中的常用分类第三章 统计数据的整理与显示 一、统计数据分组的意义 统计数据分组是指根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干类型(组),使组内的差异尽可能小,组间的差别尽可能明显,从而使大量无序的、混沌的数据变为有序的、反映总体特征的资料。 统计分组的基本作用表现在以下三个方面。 (一)划分现象的不同类型 统计分组的最基本作用,就是把复杂现象划分为各个性质不同的组成部分,以认识事物质的差别。 (二)反映总体的内部结构 在统计分组基础上,计算各部分占总体的比重可揭示总体内部结构,表明总体中各部分与整体以及各部分之间存在的数量关系,从而反映事物的构成特征和性质。 (三)分析现象之间的依存关系 客观现象之间存在着广泛的相互依存关系,根据研究目的,按照一定标志对总体进行分组,然后通过观察相关标志的数量变化,可揭示相关事物之间的依存关系。第三章 统计数据的整理与显示二、统计数据分组的类型统计数据分组按反映研究对象的特点和分组的形式分类主要有以下类型。(一)属性分组和变量分组属性分组是按照反映事物属性的品质标志进行的分组。例如,人口按性别分组。变量分组是指按照数量标志进行的分组。例如,学生按考试成绩分组。(二)简单分组、复合分组和分组体系简单分组就是将总体按一个标志进行的分组。这种分组只能从某一方面去说明总体特征。例如,按所有制性质可将企业作如下简单分组: 国有企业 集体企业 股份合作企业 联营企业第三章 统计数据的整理与显示 复合分组是按照两个或两个以上的标志,重叠起来对总体进行分组。这里所谓重叠,是指在前一次分组结果内部再进行下一次分组。例如,某高等学校的学生总体按科别、性别、年龄等标志所进行的复合分组: 20岁以上 男生 20岁以下 文科 20岁以上女生 20岁以下学生 20岁以上 男生 20岁以下理科 20岁以上 女生20岁以下图3.1第三章 统计数据的整理与显示 分组体系是按照两个或两个以上相互联系、相互补充的标志,对被研究对象进行平行分组所形成的体系。分组体系可以从不同角度、不同方面对某一现象作出比较全面的说明。例如,某地企业分组体系: (1)按所有制分 国有企业 集体企业 股份合作企业 联营企业 (2)按产业分 第一产业 第二产业 第三产业 (3)按规模分 年增加值10000万元及以上的企业 年增加值5000~10000万元的企业 年增加值1000~5000万元的企业 年增加值在1000万元以下的企业第三章 统计数据的整理与显示三、统计数据分组的方法统计数据分组的关键在于分组标志的选择和各组界限的划分。(一)分组标志的选择分组标志的选择是统计分组的核心问题,分组标志就是对统计总体进行分组的标准或依据。选择正确分组标志,是统计分组能充分发挥其作用的前提。选择分组标志必须遵循穷尽的原则、互斥原则和反映事物本质的原则。(二)统计分组方法就是在分组标志变异范围内划定各相邻组间的性质界限和数量界限。它又分为按品质标志分组和按数量标志分组:1 按品质标志分组按品质标志分组是按对象的属性特征分组,它又有简单品质分组和复杂品质分组两种情况。简单品质分组是指分组标志一经确定,组的名称和组数也就随之确定,而且各单位应分在哪一组也比较明确,不存在组与组之间界限区分困难的分组。例如,人口按性别分组。第三章 统计数据的整理与显示复杂品质分组如工业部门分类、人口职业分类等。对这些复杂问题的分组,统计学上称为分类。统计分类不仅涉及复杂的分组技术,而且涉及国家的政策和科学理论。为保证各种分类的科学性,统一性和完整性,便于各个部门掌握和使用,国家统计局会同有关部门制定了统一的分类目录,在全国范围内实行。如商品分类目录、工业产品分类目录、工业部门分类目录等。2 按数量标志分组按数量标志分组是指选择反映事物数量差异的数量标志,根据其变异范围区分各组界限,将总体划分为若干个性质不同的组成部分。根据数量标志值的变动特征,分为单项式分组和组距式分组两种。第三章 统计数据的整理与显示单项式分组 它是指按每一个具体变量值对现象总体所进行的分组。如工人按日产量分组(见表3.1)。单项式分组适用于离散型变量,且变量值不多、变动范围较小的情况。表3.1 工人按日产量分组表按日产量分组(件) 工人数(人) 比例(%)353637383940 202530354050 1012.51517.52025合计 200 100第三章 统计数据的整理与显示组距式分组 它是指按变量值的一定范围对现象总体所进行的分组。在现象总体的变动范围内,划分若干个性质不同的区间。当离散型变量变动范围比较大、总体单位数又很多,若采用单项式分组,把每一变量值作为一组,必然使组数过多,次数过于分散,不能反映总体内部各部分的性质和差异,从而失去了统计分组的真正意义。至于连续型变量,由于其变量值无法一一列举,更不能采用单项式分组,因此在这些情况下就需要采用组距式分组方法。例如,某市职工家庭按户平均收入可编制表3.2所示组距式分组。第三章 统计数据的整理与显示表3.2职工家庭户平均收入分组表按户平均收入分组(千元) 户数(户) 占总户数比例(%)3以下3~44~55~66~77~88以上 9002510436028901440650630 6.718.832.621.610.84.94.7合计 13880 100第三章 统计数据的整理与显示在组距式分组中,涉及到组限、组距、组数、组中值等概念。①组限 组限是用来表示各组之间界限的变量值,是决定事物质量的数量界限。在每一组中最小的变量值为下限;最大的变量值为上限。组限有重合与不重合两种:重合式就是相邻两组中,前一组的上限与后一组的下限数值相重叠;不重合式,是指前一组的上限与后一组的下限两变量值紧密相连但不重叠。组距式分组中,常常会遇见首末两组“开口”的情况,即用“×××以下”表示第一组,用“×××以上”表示最后一组,这些有上限无下限或有下限无上限的组称为开口组,如“3以下”和“8以上”即为开口组。②组距 组距是指一组变量值的区间长度,也就是每一组的上限与下限之间的距离。即:组距=上限-下限。③组数 组数即分组个数。在所研究总体一定的情况下,组数的多少和组距的大小是紧密联系的。一般说来,组数和组距成反比关系,即组数少,则组距大;组数多,则组距小。第三章 统计数据的整理与显示④组中值 组中值即组距的中点数值,它是各组变量值的代表水平。在重合式组限的分组中,它是各组上限与下限的简单平均数;在非重合式组限的分组中,它是本组下限与后一组下限的简单平均数。重合式组限组的组中值=(上限+下限)/2非重合式组限组的组中值=(本组下限+后一组下限)/2缺下限组的组中值 =上限-邻组组距/2=邻组组中值-邻组组距缺上限组的组中值 =下限+邻组组距/2=邻组组中值+邻组组距第三章 统计数据的整理与显示四、统计资料的再分组统计资料的再分组是指把统计分组资料按某种要求重新划定各组界限,再将资料中的单位数或比重分布做出相应的调整。例如,表3.3所示某工业部门劳动生产率的分组资料与研究目的不一致,主要是组数多、组距小,不利于简明地观察问题,需要进行再分组。为了与相邻地区同行业的同类指标进行比较,将企业的劳动生产率重新划分为四组,即人均产值在12.5千元以上的为优秀企业;在10~12.5千元之间的为良好企业;在7.5~10千元之间的为一般企业;7.5千元以下的为后进企业。其再分组的结果如表3.4所示。第三章 统计数据的整理与显示表3.3 某工业部门劳动生产率分组表组号 按劳动生产率分组(千元/人) 企业数比例(%) 职工数比例(%) 总产值比例(%)12345678910 6以下6~77~88~99~1010~1111~1212~1313~1414以上 1114101520912423 6.209.4810.7816.2620.0012.9311.545.402.694.72 9.6612.8313.0016.7819.1210.989.043.821.842.93合 计 100 100 100第三章 统计数据的整理与显示表3.4 某工业部门劳动生产率再分组表组号 按劳动生产率分组(千元/人) 企业数比例(%) 职工数比例(%) 总产值比例(%)ABCD 7.5以下7.5~1010~12.512.5以上 3040237 21.0741.6527.1710.11 28.9942.4021.936.68合 计 100 100 100第三章 统计数据的整理与显示表3.4再分组的步骤如下:第一步确定再分组的各自范围。如A组包括原第1组、第2组的全部和第3组的一部分;第二步计算新组各自相连组的比例。可用相连组的部分组距除以相连组的组距之和而求得。其具体计算过程为:A组在相连组中所占比例=(7.5-7.0)/(8.0-7.0)=0.5 ,B、C、D组计算方法相同。第三步确定再分组的对应单位数。即计算各组变量值的区间范围所对应的单位数。第三章 统计数据的整理与显示五、国民经济统计中的常用分类(一)经济成份分类按经济成份分类是为了反映我国经济中所有制成份构成情况。现阶段我国经济成份分类与代码如表3.5所示。表3.5 经济成份分类代码代 码 分类及构成111122212223 公有经济 国有经济集体经济 非公有经济 私有经济 港澳台经济 外商经济第三章 统计数据的整理与显示(二)登记注册类型分类按登记注册类型不同,可以将所有的企业分为内资企业、港澳台商投资企业和外商投资企业三大类。(三)国民经济行业分类《国民经济行业分类与代码》(国家标准)按基层单位的主要活动的同质性归口,将社会经济活动划分为门类、大类、中类和小类四级。(见表3.6)。(四)三次产业分类三次产业分类是根据产业部门的发展顺序和层次进行的分类。目前,我国三次产业的划分为:第一产业:农、林、牧、渔业。第二产业:工业和建筑业。工业包括采掘业、制造业、电力煤气及水的生产和供应业。第三产业:除上述第一、第二产业以外的其它各行业。又可分为两大部门,即流通部门和服务部门。(五)机构部门分类机构部门又称为制度部门或财务收支部门。机构部门分类是从取得收入和支配收入、筹集资金和运用资金的财务决策权的同一性进行的分类。我国的机构部门包括非金企业部门、金融机构部门、政府部门和住户部门等四类。第三章 统计数据的整理与显示表3.6 《国民经济行业分类与代码》(国家标准)统计表门类 类别名称 大类数 中类数 小类数ABCDEFGHIJKLMNOP 农、林、牧、渔业采掘业制造业电力、煤气及水的生产和供应业建筑业地质普查业、水利管理业交通运输、仓储及邮电业批发和零售贸易、餐饮业金融、保险业房地产业社会服务业卫生、体育和社会福利业教育、文化艺术及广播电影电视业科学研究和综合技术服务业国家机关、政党机关和社会团体其他行业 57303329623933241 14181727882132832911181252 16535441081522671133617251252合 计 92 368 846第三章 统计数据的整理与显示一、频数分布及其种类在分组的基础上,把所有数据或总体单位按组归并、排列,形成所有数据或总体各单位在各组间的分布,称为频数分布,又称为分布数列。例如我国人口的性别分布(见表3.7)。频数分布由两个部分构成,一是组别,二是分布在各组的频数(f)和频率(f/∑f)。频率有两个性质:(1)0≤ f/∑f ≤1;(2) ∑(f/∑f)=1。频数分布的种类图示如下:品质分布频数分布 单项式频数分布 变量分布 等距式分布 组距式频数分布 异距式分布图3.2频数分布的种类第三章 统计数据的整理与显示(一)品质频数分布品质频数分布,简称为品质数列,它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴,如表3.9就是一个品质数列。(二)变量频数分布变量频数分布,简称为变量数列,它是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。变量数列又分为单项数列和组距数列。1.单项数列。单项数列是以一个变量值为一组编制的变量频数分布,如表3.1就是一个单项数列。2.组距数列。组距数列是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布,如表3.2就是一个组距数列。第三章 统计数据的整理与显示二、累计频数和累计频率累计频数和累计频率是将变量频数分布中各组频数或频率依次累加而得到的各组累计频数或累计频率。累计的方法有两种:一是向上累计,即将各组频数或频率由变量值低的组依次向变量值高的组累计,它表明从第一组下限开始到本组上限为止的累计频数或累计频率;二是向下累计,即将各组频数或频率由变量值高的组依次向变量值低的组累计,它表明从最末一组的上限开始到本组下限为止的累计频数或频率。累计频数和累计频率可以概括地反映总体各单位的分布特征,如表3.7。第三章 统计数据的整理与显示三、频数(次数)分布的主要类型客观现象的频数(次数)分布主要有钟形分布、U形分布和J形分布三种类型。(一)钟形分布钟形分布是指靠近两端的变量值分配次数较少,中间变量值则分配次数较多,绘制成的曲线图形状宛如一口古钟的次数分布。(二)U形分布U形分布的特征与钟形分布特征恰恰相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,分布特征是“两头大,中间小”,绘成的曲线图形如英文字母“U”。例如,人口在不同年龄的死亡率一般近似地表现为U形分布。(三)J形分布J形分布有正反两种情况:次数随变量值增大而增多时所绘成的曲线图形如英文字母“J”,称为正J形分布;次数随变量增大而减少时所绘成的曲线图犹如反写的英文字母“J”,称为反J分布。第三章 统计数据的整理与显示几种常见的频数分布:(a)钟形正态(b)钟形偏态正偏(右偏)负偏(左偏)(c)J形分布正J形反J形(d)U形分布第三章 统计数据的整理与显示四、频数分布的编制频数分布有品质频数分布和数量频数分布两种。(一)品质频数分布的编制编制品质数列,首先应按品质标志对总体作属性分组,然后划分各组界限。再汇总各组单位数,并编成统计表,即得品质数列。例如某班学生的性别、年龄和统计学考试成绩资料如表3.8所示,按性别分组,可编制成表3.9所示品质数列。表3.9 某班学生按性别分组按性别分组 学生数(人)f 比重(%)f/∑f男女 1917 52.7847.22合计 36 100第三章 统计数据的整理与显示(二)变量频数分布的编制变量数列编制的根本目的在于通过现象的数量差别去描述事物质的区别。即不同的变量组别之间,事物具有质的差别。1.单项数列的编制。对于离散型变量,如果变量值种类较少且变动范围较小,可编制单项数列。如表3.8中的年龄最大20岁,最小16岁,极差仅4岁,且变量值只有5种,故可编制单项数列。编制单项数列时,首先将各种变量值按大小顺序排列,其次计算各变量值的频数和频率,最后将结果以表格的形式表现出来(见表3.10)。第三章 统计数据的整理与显示表3.10 某班学生年龄分组表按年龄分组(岁) 学生数(人)f 比重(%)f/∑f1617181920 2913102 5.5625.0036.1027.785.56合计 36 100第三章 统计数据的整理与显示2.组距数列的编制。离散型变量变动幅度较大,变量值的项数较多时,应编制组距数列。连续型变量只能编制组距数列,下面利用表3.9中统计学考分编制组距数列,其过程为:(1)将原始数据按大小顺序排列,并确定最大值、最小值和全距R。表3.9中统计考分全距R=98-49=49分。(2)确定组距数列类型。由于考分分布均匀,可编制等距数列。(3)确定组数和组距。等距数列组距=全距÷组数。确定组数和组距时,应遵循以下原则:①考虑到组距内的同质性。本例中必须将及格与不及格的质的界限体现出来,不能分成45—55、55-65、……。②要能反映总体分布规律,即要体现原始数据分布的集中趋势或离中趋势。③组距不能太大或太小。组数一般应在5-15组内,组距最好是5的整数倍数。④在等距数列情况下,如果总体单位数不是很多,变量变动范围不是很大时,可用斯特吉斯经验公式计算出一个参考组距。公式为:i=R/(1+3.22lgN)。式中,i为组距,R为全距,N为总体单位数。将表3.9资料代入公式,则i=49/(1+3.22lg36)≈8.0(分)。故可定组距为10分。组数=49/10≈5(组)。第三章 统计数据的整理与显示(4)确定组限和组限的表示法。确定组限应遵循以下几条原则:①最小组下限低于或等于最小变量值,最大组上限应大于最大变量值;②如果有极端值,可用开口组;③组限应有利于表现总体单位分布规律;④对于等距数列,如果组距是5的倍数,则每组下限也最好是5的倍数。此外,还应确定组限的表示法是用同限,还是用异限。学生统计学考分一例中,因为成绩都是整数,既可用同限,也可用异限。若选用同限,则组限可表示为:60分以下、60-70、70-80、80-90、90-100五个组。(5)从最小组起依次排列,并分别计算各组频数和其他有关指标,形成分组统计表(见表3.11)。第三章 统计数据的整理与显示表3.11 某班学生统计学考试成绩分组表按考分分组(分) 学生人数(人) 比重(%)60以下60~7070~8080~9090~100 3510117 8.3313.8927.7830.5619.44合 计 36 100第三章 统计数据的整理与显示第四节 统计数据的显示一、统计表二、统计图第三章 统计数据的整理与显示一、统计表(一)统计表的概念和构成统计表就是由纵横交叉的线条所组成的,用于显示统计数据的表格。统计表的运用范围极其广泛,其主要优点是:能使统计资料条理化,更清晰地表述统计数据之间的相互联系;统计数据的显示简明易懂;便于计算和比较表内的各项统计指标,并易于检查数字的完整性和正确性。统计表从形式上看由总标题、横标目、纵标目和统计数字四个要素构成(见表3.12) 。总标题是统计表的名称,用以概括说明整个表的内容,一般位于表的上方中央。横标目(也称横行标题)是横行内容的名称,代表统计所要说明的对象(总体及其分组),通常也称为主词,一般列在表的左边。第三章 统计数据的整理与显示纵标目(也称纵栏标题) 它是纵栏内容的名称,是用来说明主词情况的统计指标,通常也称为宾词,一般列在表内的上方。统计数字是各项指标的具体数值,内容由横标目和纵标目所限定,其数字可以是绝对、相对数或平均数。从内容上看由主词和宾词构成。主词是统计表所要说明的对象,一般是总体、总体的各组、总体单位名称或时间等。宾词是用来说明主词的各个指标,包括指标名称和指标数值。通常将主词放在表的左方,宾词放在表的右方。第三章 统计数据的整理与显示表3.12 某省国民生产总值统计表 总标题(2006)地区 国民生产总值(亿元) 比上年增长(%)甲市乙市丙市丁市戊市 30001000980800600 10.015.012.011.09.0合计 6380 9.7纵标目横标目主词宾词数字资料第三章 统计数据的整理与显示(二)统计表的分类通常按作用、反映对象的特点和分组情况对统计表进行分类。1.调查表、汇总表和分析表。按作用不同分为调查表、汇总表和分析表。调查表是在统计调查中用于登记、搜集原始资料的表格;汇总表是用于统计资料整理、汇总的表格;分析表是用于统计分析的表格。2.空间数列表和时间数列表。按反映统计数列时空性质不同,分为空间数列表和时间数列表。空间数列表又称静态表,是反映同一时间条件下不同空间范围内的统计数列的表格,它可以说明现象在不同空间内数量分布状态。第三章 统计数据的整理与显示时间数列表又称动态表,是反映同一空间条件下不同时间上的统计数列的表格,它可以说明在既定的空间范围内现象在不同时间上的变动过程。3.简单表、分组表和复合表。统计表按对总体分组的情况不同,可以分为简单表、分组表和复合表。简单表是指对总体未做任何分组,仅按单位名称或时间顺序排列而成的统计表。分组表是按一个标志进行分组而形成的统计表,如表3.10。利用分组表可以深入分析现象的内部结构和现象间的相互依存关系。复合表是按两个或两个以上的标志进行并列分组或层叠分组而形成的统计表(见表3.13),复合表可以反映所研究对象受几种因素的共同影响而发生的变化。第三章 统计数据的整理与显示(三)统计表的编制规范统计表应符合科学、简明、实用、美观、便于比较,能够准确反映被研究现象的数量特征。因此,设计和填写统计表时必须遵循以下规范要求。(1)统计表的标题、项目、指标要简明扼要,能准确反映内容,使人一目了然,便于分析。如果指标的计量单位只有一个,则通常列在表的右上角,如果计量单位较多,则列在相应的指标栏内。(2)统计表纵栏、横行的排列要尽量反映出内容方面的逻辑关系。(3)当栏目较多时,可编号以说明其相互关系。主词栏和计量单位栏常用甲、乙、丙等文字编号,宾词栏常用1、2、3等数字编号。(4)表中的合计栏可以排在前面,也可以排在最后,如果只列出其中部分项目,则合计栏必须排在前面。(5)表中的统计数字要根据纵横关系对位,数字为零时要写出“0”来,不应填写数字的空格用“─”线表示;未发生的数字空着不填;估算的数字应在表下说明;无法取得的资料用“…”号表示;如果某项数字与邻项数字相同,则仍应填写数字,不得用“同上”、“同左”等字样或符号代替。(6)表的上下两端用粗线,左右两边不封口,纵栏之间用细线分开,横行之间可以不加线。如果横行过多,也可以每五行加一细线。第三章 统计数据的整理与显示(7)统计表的资料来源及其他需要说明的问题可在表下加以注明。表3.13 某地区2006国民生产总值和职工人数统计表项 目 国民生产总值(万元) 职工人数(人)国有经济 大型中型小型 1000090005000 140005000010000集体经济 大型中型小型 800060004600 7500110005000外商投资经济 大型中型小型 750065005400 950085005000其它经济 大型中型小型 580045004000 740081004200第三章 统计数据的整理与显示二、统计图统计图是利用几何图形和具体事物的形象来表现统计数据的一种形式。用统计图来显示统计数据,具有直观、生动、形象、易懂的优点。统计图没有冗长的数据和呆板的表格形式,易为一般人接受和理解。不同的统计图绘制方法不同,但都必须遵守如实反映、便于比较、通俗易懂、鲜明醒目、灵活机动的原则。(一)直方围和条形图1.直方图。直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标系中,横轴表示数据分组,纵轴表示频数或频率,这样各组与相应的频数就形成了一个矩形,即直方图。如根据表3.14可绘制图3.3所示直方图。第三章 统计数据的整理与显示图3.3第三章 统计数据的整理与显示2.条形图。条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。条形图可以横置和纵置,纵置时也叫柱形图,如根据某学院职工结构情况绘制的条形图如下:第三章 统计数据的整理与显示条形图和直方图不同,条形图用条形的长度(横置时)表示各类别数量的多少,其宽度(表示类别)是固定的,直方图是用面积表示数量的多少;直方图各矩形通常是连续排列,而条形图则是分开排列。(二)折线图和曲线图1 折线图也称频数多边图,它是在直方图的基础上把相邻直方形的顶边中点连接成一条折线,再把折线两端与横轴上直方形两侧延伸的假象组中点相连,就形成了频数分布折线图。折线图也可以用组中值与次数求坐标点连接而成。例如,根据表3.7可绘制图3.4所示折线图。第三章 统计数据的整理与显示图3.4第三章 统计数据的整理与显示2 曲线图曲线图是用曲线的升降起伏来表示被研究现象的变动情况及其趋势的图形。曲线图根据所示数据的性质和作用不同,可分为频数分布曲线图、动态曲线图和依存关系曲线图。在频数分布折线图的基础上,当变量数列的组数无限增多时,折线图便近似地表现为一条平滑的曲线,折线图就变成了频数分布曲线图。例如,根据表3.14资料,可绘制出图3.5所示频数分布曲线图。图3.5第三章 统计数据的整理与显示(三)圆形图和环行图1 圆形图 圆形图又称饼图,它是以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种图形。根据圆形图的作用不同,可分为圆形比较图、圆形结构图和圆形结构比较图。这里仅以圆形结构图为例介绍圆形图的画法。 圆形结构图通过圆内各扇形的面积来反映总体中各组成部分所占的比例,绘制圆形结构图的关键是正确计算各扇形的面积。由于在相同半径条件下,扇形面积与圆心角成正比,且圆心角度数为360,故各扇形的中心角度为3600×各组频率。 第三章 统计数据的整理与显示 例如,某学院专任教师、教辅人员、管理人员、服务人员、其他人员和附属人员所占比重依次为42.86%、10.71%、7.14%、14.29%、3.57%、28.57%,那么专任教师扇形的中心角度数应为360o×42.86%=154.2960,其余类推,据此可绘制圆形结构图如图3.6所示。图3.6第三章 统计数据的整理与显示2 环形图 环形图中间有一个“空洞”,总体中的每一个部分数据用环中的一段表示。环形图可以同时绘制多个总体的数据系列,每一个数据系列为一个环,可以显示多个总体各部分所占的相应比例,从而有利于进行比较研究。 设甲、乙两个教学班学生对某门课程教学评价资料如表3.18所示,据此资料作环形图如下:表3.18 课程教学情况评价表班别 非常不满意 不满意 一般 满意 非常满意甲班 2% 5% 20% 50% 23%乙班 5% 10% 30% 40% 15%第三章 统计数据的整理与显示第三章 统计数据的整理与显示(四)雷达图雷达图也称蛛网图。设有n组样本S1,S2,…,Sn,每个样本测得P个变量Xl,X2,…,Xp,共计np个观测值。要绘制这P个变量的雷达图,其具体做法是:先画一个圆并将圆P等分,得到P个点,让这P个点对应P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小用由半径上的点到圆心的距离表示,将同一个样本的值在P个坐标上的点用线段连接,这样,n个样本形成的n个多边形就是一个雷达图。雷达图在显示或对比各变量的数值时非常有用。利用雷达图也可以研究多个样本之间的相似程度。第三章 统计数据的整理与显示例如,根据某省三市居民生活消费支出构成可绘制如下雷达图:项 目 甲 市 乙 市 丙 市食品 36.20 38.40 44.00衣着 12.00 11.60 10.00家庭设备用品及服务 9.50 9.00 8.00医疗保健 7.00 6.50 5.00交通通讯 9.00 8.50 7.00娱乐教育文化服务 15.30 14.50 12.40第三章 统计数据的整理与显示第三章 统计数据的整理与显示第五节 EXCEL在统计数据整理和显示中的应用一、应用EXCEL编制统计数列二、运用EXCEL绘制统计图第三章 统计数据的整理与显示在统计数据处理阶段,利用EXCEL可以编制统计数列、统计表,绘制多种统计图,下面我们就利用本章已举的一些例子来加以说明。一、应用EXCEL编制统计数列以组距数列编制为例,利用表3.8资料:首先,打开EXCEL,把学生成绩输入A列(A2:A37)。第二,对成绩数据进行排序(按前述方法)。第三,按照排序结果计算全距,确定数据项数、组数、组距和组限。本例全距=A37-A2=98-49=49,数据项数36,可分5组,组距=全距÷组数=49÷5≈10,组限依次为60以下、60~70、70~80、80~90、90~100;第四,在B1和B2输入“按成绩分组(分)”,在B3至B8依次输入“60以下、60-70、70-80、80-90、90-100、合计”,在C1、D1输入“次数”、E1、 F1输入“向上累计”、G1、H1输入“向下累计”。在C2、E2、G2输入“人数(人)”,在D2、F2和H2输入“比重(%)”。选定C3至C7作为放置分组结果区域。然后从“插入”菜单中选择“函数”,在弹出的“插入函数”对话框中点击“选择类别”栏中的下拉箭头,选择“统计”,再在“选择函数”栏中选择“FREQENCY”函数,单击确定进入“FREQENCY”函数参数设置对话框。第三章 统计数据的整理与显示第五,在函数参数对话框中的Data_array文本栏中输入待分组的原始数据区域,本例应输入“A2:A37”;在Bins_array栏中输入组限。FREQENCY函数要求按上限分组,其统计结果是包括上限不包括下限,并且输入n个组限会给出n+1个组,为了与我们常用的分办法协调,应处理为:以数组形式输入中间4个组限,且每个组限小半个单位,即输入“59.5;69.5;79.5;89.5”。最后按Shitf+Ctrl+Enter组合键,即得分组结果(见表3.16第2列)。第六,计算次数比重和累计次数、累计比重。(1)计算比重:在D3单元格输入“C3*100/36”,确定后即出现结果“8.333333”,这时利用填充柄功能(单击D3单元格,鼠标指向右下角的黑点,当出现黑十字时,按住左鍵向下拖曳,至D7单元格放开鼠标),可依次计算出D4~D7单元格的数字。第三章 统计数据的整理与显示 (2)计算向上累计次数、比重:单击E3单元格,输入“=C3”,结果为3,再击E4,输入“=E3+C4”,结果为8,再利用填充柄计算E5~E7。用同样方法,可得F列向上累计比重。 (3)计算G列向下累计次数、比重:先击G7单元格,输入“=C7”,结果为7,再击G6,输入“=G7+C6”,结果为18,再利用填充柄计算G5~G3。用同样方法可以得到H列的向下累计比重(见表3.15)。表3.15 组距数列及累计次数计算表第三章 统计数据的整理与显示 二、运用EXCEL绘制统计图 我们仅以直方图和曲线图绘制过程来加以说明,其它图形的绘制过程大致相同,只要按“图表导向”对话框提示操作,便可绘制出各种常用图形。 (一)运用EXCEL绘制直方图 第一,打开EXCEL,把原始数据输入A列,按组距数列编制方法进行排序、分组、编制数列(仍以表3.9资料为例,见组距数列编制方法第一至第五步); 第二,接上步单击“插入”出现“图表导向…”对话框,单击下一步出现“数据区域”对话框,在“数据区域(D)”依次输入次数数据区域,本例为C3:C7, 单击下一步,便出现图形(见图3.7)。第三章 统计数据的整理与显示图3.7在实践中各直方体之间一般不留空隙,故需调整,其方法是:把鼠标指向直方体内,单击鼠标右键,出现“数据系列格式”对话框,点击其中的“选项”,在出现的“分类间距(W)”中,把其中数值调整为0,这时便得不留空隙的直方图。第三章 统计数据的整理与显示 (二)应用EXCEL绘制曲线图 第一,以表3.14资料为例,将数列各组标志值(按年龄分组、2以下、2-4、4-6、…、78-80)输入A列,各组次数(50、70、100、…、45)输入B列。 第二,单击“插入”,在出现的对话框中单击“图表”,出现“图表导向”对话框,在其中单击“折线图”,在折线图的子图类型中选择第一种图形。 第三,单击“下一步”出现数据区域,在“数据区域(D)”中输入“A2:B37”, 再单击“下一步”,在出现的“图表导向”步骤之3中单击“标题”,在“图表标题”栏内输入图表标题,本例为“某村人口年龄分布曲线图”,然后单击“完成”便出现图3.5所示曲线图。第三章 统计数据的整理与显示本章小结 统计整理是根据统计研究目的,对统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,以反映现象总体特征的工作过程。其内容包括对资料的审核、分组、汇总和编制统计表等几个主要环节。 统计分组就是根据统计研究的需要,按照一个或几个重要的标志,将统计总体划分为若干个组成部分。统计分组有品质标志分组和数量标志分组两种。按数量标志分组又有单项式分组和组距式分组两种。组距式分组要确定好组限、组距和组数等。 频数分布是在统计分组的基础上形成的反映总体单位在各组中分布状况的统计数列。它有品质数列和变量数列两种。变量数列可以编制成次数分布表和分布图。次数分布主要有钟形分布、U形分布和J形分布三种类型。 统计表是把统计数据按照一定的结构顺序,用表格显示的一种形式。统计表由总标题、横标目、纵标目和统计数字等四个基本要素构成。编制统计表必须注意规范要求。 统计图是借助几何图形或具体形象显示统计数据的一种形式。常用的有直方图、条形图、曲线图和圆形图等。第三章 统计数据的整理与显示同步训练一、单项选择题1.统计分组的关键是( )A确定分组标志和划分各组界限 B确定组距和组数C确定组距和组中值 D确定全距和组距2.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( )A 260 B 215 C 230 D 1853.频数分布用来表明( )A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度4.统计表的主词是统计表所要说明的对象,一般排在统计表的( )A左方 B上端中部 C右方 D下方5.用组中值与次数求坐标点连接而成的统计图是( )A直方图 B条形图 C曲线图 D折线图第三章 统计数据的整理与显示二、多项选择题1、统计分组的作用在于( )A区分现象的类型 B反映现象总体的内部结构C比较现象间的一般水平 D分析现象的变化关系 E研究现象之间数量的依存关系2.指出下列分组哪些是属性分组( )A人口按性别分组 B企业按所有制分组C家庭按收入水平分组 D职工按文化程度分组E商店按营业额分组3.统计数据的预处理,包括( )A数据分类 B数据筛选 C数据审核 D数据订正 E数据排序4.统计数据整理的内容一般有( )A对原始数据进行预处理 B对统计数据进行分组C 对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图5.某单位100名职工按工资额分为300以下、300-400、400-600、600-800、800以上等五个组。这一分组( )A是等距分组 B分组标志是连续型变量C末组组中值为800 D相邻的组限是重叠的E某职工工资600元,应计在"600-800"元组内第三章 统计数据的整理与显示三、案例分析某学院60学生统计学课程考试成绩如下:89 88 76 99 74 60 82 60 93 99 94 82 77 79 97 78 87 84 79 65 98 67 59 72 56 8l 77 73 65 66 83 63 89 86 95 92 84 85 79 70 80 89 70 65 90 95 80 50 95 78 66 83 90 82 71 63 54 75 96 62 试据表中资料编制适当的统计数列、计算累计次数、编制统计表、绘制直方图,并根据图、表说明学生成绩分布状态和特点。阅读、讨论与思考阅读袁卫、庞皓、曾五一主编《统计学》(高等教育出版社2000年7月第1版)、贾俊平主编《统计学》(中国人民大学出版社2003年6月第1版)相关章节,指出组距数列编制的步骤和方法有哪些?统计资料的图示方法有哪些,如何绘制这些统计图。谢谢观看, 再见!中国高等教育出版社 展开更多...... 收起↑ 资源预览