资源简介 (共72张PPT)第二章 统计数据的收集、整理与展示第一节 统计数据的收集第二节 统计数据的整理第三节 统计数据的展示学习目标1、理解统计数据收集的概念、要求以及种类;2、掌握统计调查的各种具体组织形式;3、掌握统计调查方案设计的基本内容;4、明确统计整理的概念和工作程序;5、掌握统计分组的概念、作用、原则、类型以及统计分组方法;6、熟悉分配数列的概念与种类;7、掌握变量数列的编制方法;8、熟悉统计表和统计图的编制技术及其应用。第一节 统计数据的收集一、统计数据收集的概念二、统计调查的要求三、统计调查的种类四、统计调查方案的设计一、统计数据收集的概念统计数据收集的概念统计资料收集的主要形式是统计调查,就是根据统计研究的目的和要求,采用科学的方法,对调查对象中各调查单位的有关标志的具体表现,有计划、有组织地进行登记,取得真实可靠统计资料的活动过程。搜集的方式有两种:一种是直接向调查单位搜集资料,即原始资料,又称为初始资料;另一种是根据研究的目的,是已经存在的经他人整理分析过的资料,一般称为次级资料或第二手资料。次级资料的使用注意问题使用二手数据,要注意数据的定义、统计口径和计算方法,避免数据的错用、误用和滥用。在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。一、统计数据收集的概念二、统计调查的要求准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求。准确性及时性完整性统计调查必须达到准确、及时、全面,做到数字准、情况明、反映及时、内容全面。这是统计调查的基本要求。按调查的范围不同,统计调查可以分为:全面调查和非全面调查;按登记事物的时间连续性不同,统计调查可以分为:经常性调查和一次性调查;三、统计调查的种类经常性调查是指随着调查对象的发展变化,连续不断地进行调查登记的方法。全面调查是指对构成调查对象的所有总体单位,全部进行调查登记的一种调查方法。非全面调查是指对构成调查对象的一部分总体单位,进行调查登记的一种调查方法。一次性调查是指间隔一定时间的不连续调查。按组织形式不同,统计调查可以分为:统计报表和专门调查。三、统计调查的种类专门调查是指为了研究某些专门问题而专门组织的统计调查。专门调查属于一次性调查,包括普查、重点调查、典型调查和抽样调查等。统计报表是依据国家相关法律,按一定的表式和要求,自上而下统一布置、自下而上逐级提供和报送统计资料的一种统计调查方式。(一)统计报表广泛应用于政府统计,具有以下特点:四、统计调查的组织形式1、报送程序和报送时间统一规定;2、资料来源于指定原始记录;3、调查项目相对稳定,有利于资料积累;4、具有法律效力(《统计法》保障);5、统计报表主要依靠组织系统的行政力推行。种类按实施范围国家统计报表部门统计报表地方统计报表按调查范围全面统计报表非全面统计报表按填报单位基层报表综合报表按统计报表报送周期的长短日报、旬报月报、季报半年报、年报按报送方式电讯报表邮寄报表(1)一次性调查,调查某一时点现象总量。(2)全面调查。(3)工作量大。(二)普 查普查是针对某问题专门组织的一次性全面调查。特点:普查工作规模大、涉及面广、要花费大量的人力、物力、财力和时间,不宜经常组织。http://www.stats./tjsj/pcsj/(三)重点调查重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查方式。重点单位是指调查对象中的一小部分,但其某一主要标志总量在总体标志总量中却占绝大比重,重点单位的特征可以反映总体的基本情况。如了解我国钢铁生产基本情况,对鞍钢、武钢、宝钢、太钢、包钢等几个钢铁公司调查即可。它们在钢铁企业中是少数,但它们的产量在全国产量中占很大比重。适用条件:一般来说,当调查的目的和任务不要求全面性和高度准确性,而部分单位又能比较集中地反映所研究的标志或指标时,宜采用重点调查的方式。(四)典型调查典型调查是根据调查的目的和任务,在调查对象中有意识地选择若干典型单位进行的一种非全面调查方式典型单位在对总体进行分析上,选择有代表性的单位;最具有代表性的单位、最能反映总体本质特征的单位;典型单位的确定不具有客观性,不能用典型调查结果推断总体。如选取部分企业进行调查,以了解企业股份制改革后的成果及问题。(五)抽样调查抽样调查是按照随机原则,在调查对象中抽取部分单位作为样本,并根据样本资料推断总体数量特征的一种调查方式。适用条件由于全面调查的范围广,工作量大,耗费大量的人力、物力和财力,且有时也不需要或不可能进行全面调查,但又要了解客观现象的总体情况,就可以采用抽样调查 。如对一批灯泡的合格率进行调查,应该采用抽样调查方式。总体 随机样本 五、统计调查方案的设计调查方案的内容调查目的调调查查对单象位调 调查 查项 表目调调查查时期间限组织实施(一)确定调查目的1. 调查要达到的具体目标回答“为什么调查?”调查之前必须明确调查对象 调查单位? 调查对象:调查研究的总体或调查范围调查单位:是进行调查登记的标志的承担者。是构成调查对象总体的个体单位 。填报单位:统计调查中负责填报调查资料的单位(二)确定调查对象、调查单位和填报单位——即回答向谁调查、由谁提供资料填报单位与调查单位是有区别的,填报单位可以是行政上、经济上独立的单位,也可以是人,而调查单位除此之外还可以是物。填报单位和调查单位有时一致,有时不一致。例如:调查目的是调查某城镇居民受教育情况调查对象、调查单位、填报单位分别是?例如:调查机器设备的情况那调查对象、调查单位、填报单位又分别是?思 考1、确定调查项目—— 即调查什么内容调查项目:调查的具体内容,就是调查中所要登记的调查单位的特征,是依附于调查单位(总体单位)的统计标志。回答“调查什么?”(三)确定调查项目和制定调查表拟订调查项目时要注意几个原则:- 调查项目要少而精;- 调查项目含义要明确;- 尽可能做到各个调查项目之间有一定的联系。(三)确定调查项目和制定调查表调查表:即各个调查项目按照一定的顺序排列在一定表格中形成的表格。(三)确定调查项目和制定调查表调查表的内容表头:用来表明调查表的名称以及填写调查单位名称、性质、隶属关系等。表体:调查表的主要部分,包含栏目、计量单位等。表脚:包含调查者(填报人)的签名和调查时间等。一览表在一张表上登记若干个调查单位,但调查的项目不能过多。在一张表上登记一个调查单位,可以容纳较多的项目。调查表分为:(三)确定调查项目和制定调查表单一表要区别调查时间和调查期限的不同:调查时间是指调查资料所属的时间(时点或时期),即所谓的客观时间,也就是调查资料所反映的现象客观存在的时间。(四)确定调查时间和调查期限调查期限是指进行调查工作的起讫时间。包括搜集资料和报送资料的整个工作所需要的时间。其主要内容包括:1、组织领导机构和参加调查的单位和调查人员的组成;2、调查前各种准备工作,包括宣传教育、人员培训、调查文件的准备及试点工作;3、调查经费的预算和开支办法;4、调查结果的提交或公布时间。(五)制定调查的组织实施计划第二节 统计数据的整理一、统计整理的概念和工作程序二、统计分组三、分配数列一、统计整理的概念和工作程序统计整理,是根据统计研究目的和统计分析的要求,将统计调查所获得的原始资料进行科学的分类和汇总,或对简单加工过的资料进行再加工,使之系统化、条理化,从而得出能够反映事物总体特征资料的工作过程。通过统计整理将社会现象的个体数量表现过渡到对总体的综合数量表现,得到描述现象总体数量特征的综合指标数值。统计整理的工作程序:制定统计整理方案审核调查资料对调查资料进行分组、汇总和计算整理后的统计资料的再审核将整理结果编制统计表或绘制成统计图统计整理的工作程序(一)统计分组的概念、作用二、统计分组统计分组的概念:根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。揭露社会经济现象的类型,反映各类型的特点。(1)类型分组类 型 2000年 2001年 2002年 2003年农业 13 873.6 14 462.8 14 931.5 14870.1林业 936.5 938.8 1 033.5 1239.9牧业 7 393.1 7 963.1 8 454.6 9538.8渔业 2 712.6 2 815.0 2 971.1 3137.6合 计 24 915.8 26 179.6 27 390.8 29691.8例单位:亿元2.统计分组的作用说明社会经济现象的内部结构。(2)结构分组年 份 2000 2001 2002 2003第一产业 16.4 15.8 15.3 14.6第二产业 50.2 50.1 50.4 52.5第三产业 33.4 34.1 34.3 33.1合 计 100.0 100.0 100.0 100.0例我国国内生产总值构成(%)2.统计分组的作用研究经济现象之间的依存关系。(3)分析分组耕作深度分组(cm) 地块数 平均收获率(斤/亩)10-12 7 40012-14 10 46014-16 16 54016-18 18-20 12 5 620680例某乡某种农作物的耕作深度与收获率的关系2.统计分组的作用二、统计分组(二)统计分组的原则穷尽原则,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。互斥原则,就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。组内同质、组间异质原则。是把同质总体中具有不同性质的单位分开,性质相同的单位合在一起。选择分组标志的原则根据研究问题的目的来选择要选择最能反映被研究现象本质特征的标志要结合现象所处的具体历史条件或经济条件来选择分组标志的选择品质标志分组 —— 反映事物属性差异1.按分组标志的特征不同分为(1)单项式分组——以每一变量值作为一组适用于离散型变量,变量值不多、变动范围不大。数量标志分组 —— 反映事物数量差异(三)统计分组的种类(2)组距式分组——把变量值划分为几个区间适用于变量变动幅度大、项目多的分组。按性别分组 职工人数 绝对数 比重(%)男 女 合计 180 120 300 6040100某外贸企业职工的性别构成情况品质标志分组按年龄分组 职工人数 绝对数 比重(%)20岁以下 20—30岁 30—40岁 40-50岁 50岁以上 合计 24 120 84 39 33 300 840281311100某外贸企业职工的年龄构成情况数量标志分组单项式分组按数量分组 高校数 绝对数 比重(%)1 2 3 3个以上 合计 40 120 6 4 170 23.570.63.52.4100某省高校图书馆数量情况表家庭人均月收入 (元) 家庭户数(户)400以下 280400~500 680500~600 1800600~700 3200700以上 500合计 64602012年某地区职工家庭人均月收入资料表组距式分组2.按分组标志的个数分对社会经济现象需要从各方面进行观察和分析研究,需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。简单分组 —— 按一个标志对总体进行分组复合分组 —— 按两个或两个以上标志对同一总体进行分组(三)统计分组的种类按性别分组 职工人数 绝对数 比重(%)男 女 合计 180 120 300 6040100某外贸企业职工的性别构成情况简单分组按专业技术职务分组 按年龄分组 合计30岁及以下 31—45岁 46—60岁 61岁以上研究员 副研究员 助理研究员 其他 80合计某科研机构科研人员基本情况复合分组(一)分配数列的概念统计总体按照某一标志分组以后,将总体中所有单位按组归类并排列,形成总体中各个单位数在各组间的分布,称频数分布或次数分布。次数或频数:是分布在各组中的总体单位数,通常用符号f表示。频率:是各组次数与总次数之比。三、分配数列例月工资分组(元) 工人数(人) 占总数比重(%)2000 以下 210 39.62000-2500 187 35.32500 以上 133 25.1合 计 530 100.0组别(变量) 次数(频数) 频率频数分布包括两个要素:总体按某标志所分的组的名称和各组的次数或频率频数分布满足两个条件:即各组频率大于零,各组的频率总和等于1(100%)按分组标志特征不同分为品质数列变量数列(二)频数分布的种类某班学生的性别构成情况按性别分组 绝对数人数 比重(%)男 30 75女 10 25合计 40 100组别 次数 频率三、分配数列某班学生的性别构成情况按性别分组 绝对数人数 比重(%)男 30 75女 10 25合计 40 100组别 次数 频率品质数列按品质标志分组形成的用来观察总体单位中不同属性的单位分布情况的数列。三、分配数列组距式分组单项式分组依据数量标志分组所编制的分配数列。变量数列三、分配数列单项式变量数列例按每个变量值为一组形成的数列适用于离散型变量,且变量值少。三、分配数列组限:组距数列中,各组变量值变动的界限上限:组内最大变量值,下限:组内最小变量值。组距:就是上限与下限之差,即:组距=组上限-组下限用变量值变动的一定范围(即组距)代表一个组所形成的变量数列。组距式变量数列三、分配数列组距式数列,根据组距不同分为:等距数列—— 各组的组距相等适用于标志值变动比较均匀的情况下不等距数列——各组的组距不相等在下列情况下,就考虑采用异距分组:1、标志值分布很不均匀的场合;2、标志值相等的量具有不同意义的场合;3、标志值按一定比例发展变化的场合;三、分配数列三、分配数列直接将每一个变量值作为一组,汇总计算各组相应的单位数,然后利用表格形式列示即可。单项式数列的编制例:车间30名工人某日加工的零件个数统计如下:30 30 28 29 30 31 29 30 29 3129 29 30 27 30 29 28 31 29 2930 27 27 29 30 28 29 29 30 29要求:编制变量数列,反映工人加工零件的分布情况。(三)变量数列的编制(1)把30名工人加工零件的个数按照由小到大的顺序排列。(2)进行分组。由于变量值只有27、28、29、30、31,因此,可以把每一个变量值作为一组,计算各组变量值出现的次数,按顺序加以排列,如下表所示。加工零件数(个) 工人数(人) 比重(%)27 3 1028 29 30 31 3 12 9 3 10403010合 计 30 10030名工人某日加工零件数分布表1.排序将变量值按大到小的顺序排列,确定最大值、最小值,计算全距。 全距=最大值-最小值2.确定组距和组数组距:组距是每个组中最大值与最小值的差。组数:即数列分组的数目。等距数列组数=全距÷组距3.确定组限组限:组限是指分组的数量界限,包括上限和下限。上限是各组的最大变量值,下限是指各组的最小变量值。若一组内只有上限没有下限或只有下限没有上限,称此组为开口组;上限与下限都齐全的组称为闭口组。组距式数列的编制具体确定组限时,要考虑以下几点:1、第一组的下限应小于等于最小变量,最后一组的上限应大于最大变量值。2、组限的表示方法对于连续型变量,采用相邻两组上下限重叠的方式,即上一组的上限同时也是下一组的下限。对于离散型变量,一般也采用连续型变量的组限表示法。如职工的工资可分为1000元以下,1000~2000元,2000元以上。2000元的职工分哪一组呢?上限不在内4.计算组中值组中值:各组中点位置所对应的变量值。闭口组组中值:组中值=(上限+下限)÷2当遇到开口组时,其组中值以相邻组组距为依据计算,即: 缺上限组的组中值=下限+(相邻组组距÷2)缺下限组的组中值=上限-(相邻组组距÷2)组距式数列的编制若开口组的下限为2000,相邻组的组距为500,则该开口组的组中值为( )A.2500 B.2250 C.2100 D.2200B将总体各单位分配到各组,计算出各组的次数。1、向上累计:是将各组次数或频率,由变量值小的组向变量值大的组逐组累加,表示各组上限以下向包含的总体次数和比率有多少。2、向下累计:是将各组次数或频率,由变量值大的组向变量值小的组累加,表示各组下限以上总共所包含的总体次数和比率有多少。5.编制变量数列组距式数列的编制某车间50名工人日加工零件数,请编制适当的组距式数列(单位﹕件)117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121(1)排序(2)确定组距和组数等距数列组数=全距÷组距=(139-107)÷10=4组(3)确定组限100-110;110-120;120-130;130-140(4)确定每个组的频数和频率(5)必要的时候计算累计频数和频率按零件数分组 频数(件) 频数(%) 向上累计频数 向下累计频数 向上累计频率 向下累计频率100-110 3 6110-120 13 26120-130 24 48130-140 10 20合计 50 100某车间50名工人日加工零件数情况表1.钟形分布2.U形分布(五)次数分布的类型3.J形分布三、频数分布的类型第三节 统计数据的展示一、统计表二、统计图结构:从表式上看:总标题、横行标题、纵栏标题和指标数值四个部分从内容上看:由主词栏和宾词栏两个部分组成。一、统计表(一)统计表的定义和结构统计表:表现为经过整理的统计数据的表格。例分组 总产值(万元) 职工人数(人) 劳动生产率(元/人)P 1 2 3大型中型小型合计2015年某月某公司各企业劳动生产率统计表单位____横行标题主词宾词总标题纵栏标题数据资料(指标数值)统计表的结构和内容按主词的结构分类:简单表、分组表和复合表。一、统计表(二)统计表的分类简单表:统计总体未经任何分组,仅按时序和空间罗列的统计表。分组表:统计总体仅按一个标志进行分组的统计表。复合表:统计总体按两个或两个以上标志进行重叠分组的统计表。(三)统计表的编制原则1.总标题须简明扼要表达出全表的内容;2.各标题要确切反映表的内容,且表格安排合理;3.指标数值要位数对齐,合计一般放在表的尾部;4.对指标内容作必要说明时,可加注在表的下方;5.表的上下边线(基线)用粗实线或双线,表的两边是开口式;6.纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。总原则:合理、科学、实用、简练、美观。一、统计表(一)直方图用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图二、统计图(二)条形图用宽度相同的条形的高度或长短来表示各类别数据的图形有单式条形图、复式条形图等形式绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图直方图与条形图的区别条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示品质数据,直方图则主要用于展示数值型数据(三)饼图也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定(四)环形图环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究(五)折线图表示时间序列数据趋势的图形时间一般绘在横轴,数据绘在纵轴图形的长宽比例大致为10:74. 一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断谢谢 展开更多...... 收起↑ 资源预览