第二章 统计数据的收集、整理与展示 课件(共72张PPT)-《统计学》同步教学(电工版)

资源下载
  1. 二一教育资源

第二章 统计数据的收集、整理与展示 课件(共72张PPT)-《统计学》同步教学(电工版)

资源简介

(共72张PPT)
第二章 统计数据的收集、
整理与展示
第一节 统计数据的收集
第二节 统计数据的整理
第三节 统计数据的展示
学习目标
1、理解统计数据收集的概念、要求以及种类;
2、掌握统计调查的各种具体组织形式;
3、掌握统计调查方案设计的基本内容;
4、明确统计整理的概念和工作程序;
5、掌握统计分组的概念、作用、原则、类型以及统计分组方法;
6、熟悉分配数列的概念与种类;
7、掌握变量数列的编制方法;
8、熟悉统计表和统计图的编制技术及其应用。
第一节 统计数据的收集
一、统计数据收集的概念
二、统计调查的要求
三、统计调查的种类
四、统计调查方案的设计
一、统计数据收集的概念
统计数据收集的概念
统计资料收集的主要形式是统计调查,就是根据统计研究的目的和要求,采用科学的方法,对调查对象中各调查单位的有关标志的具体表现,有计划、有组织地进行登记,取得真实可靠统计资料的活动过程。
搜集的方式有两种:一种是直接向调查单位搜集资料,即原始资料,又称为初始资料;另一种是根据研究的目的,是已经存在的经他人整理分析过的资料,一般称为次级资料或第二手资料。
次级资料的使用注意问题
使用二手数据,要注意数据的定义、统计口
径和计算方法,避免数据的错用、误用和滥用。
在引用二手数据时,应注明数据的来源,以
尊重他人的劳动成果。
一、统计数据收集的概念
二、统计调查的要求
准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求。
准确性
及时性
完整性
统计调查必须达到准确、及时、全面,做到数字准、情况明、反映及时、内容全面。这是统计调查的基本要求。
按调查的范围不同,统计调查可以分为:全面调查和非全面调查;
按登记事物的时间连续性不同,统计调查可以分为:经常性调查和一次性调查;
三、统计调查的种类
经常性调查是指随着调查对象的发展变化,连续不断地进行调查登记的方法。
全面调查是指对构成调查对象的所有总体单位,全部进行调查登记的一种调查方法。
非全面调查是指对构成调查对象的一部分总体单位,进行调查登记的一种调查方法。
一次性调查是指间隔一定时间的不连续调查。
按组织形式不同,统计调查可以分为:统计报表和专门调查。
三、统计调查的种类
专门调查是指为了研究某些专门问题而专门组织的统计调查。专门调查属于一次性调查,包括普查、重点调查、典型调查和抽样调查等。
统计报表是依据国家相关法律,按一定的表式和要求,自上而下统一布置、自下而上逐级提供和报送统计资料的一种统计调查方式。
(一)统计报表广泛应用于政府统计,具有以下特点:
四、统计调查的组织形式
1、报送程序和报送时间统一规定;
2、资料来源于指定原始记录;
3、调查项目相对稳定,有利于资料积累;
4、具有法律效力(《统计法》保障);
5、统计报表主要依靠组织系统的行政力推行。
种类
按实施范围
国家统计报表
部门统计报表
地方统计报表
按调查范围
全面统计报表
非全面统计报表
按填报单位
基层报表
综合报表
按统计报表报
送周期的长短
日报、旬报
月报、季报
半年报、年报
按报送方式
电讯报表
邮寄报表
(1)一次性调查,调查某一时点现象总量。
(2)全面调查。
(3)工作量大。
(二)普 查
普查是针对某问题专门组织的一次性全面调查。
特点:
普查工作规模大、涉及面广、要花费大量的人力、物力、财力和时间,不宜经常组织。
http://www.stats./tjsj/pcsj/
(三)重点调查
重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查方式。
重点单位是指调查对象中的一小部分,但其某一主要标志总量在总体标志总量中却占绝大比重,重点单位的特征可以反映总体的基本情况。
如了解我国钢铁生产基本情况,对鞍钢、武钢、宝钢、太钢、包钢等几个钢铁公司调查即可。它们在钢铁企业中是少数,但它们的产量在全国产量中占很大比重。
适用条件:
一般来说,当调查的目的和任务不要求全面性和高度准确性,而部分单位又能比较集中地反映所研究的标志或指标时,宜采用重点调查的方式。
(四)典型调查
典型调查是根据调查的目的和任务,在调查对象中有意识地选择若干典型单位进行的一种非全面调查方式
典型单位
在对总体进行分析上,选择有代表性的单位;
最具有代表性的单位、最能反映总体本质特征的单位;
典型单位的确定不具有客观性,不能用典型调查结果推断总体。
如选取部分企业进行调查,以了解企业股份制改革后的成果及问题。
(五)抽样调查
抽样调查是按照随机原则,在调查对象中抽取部分单位作为样本,并根据样本资料推断总体数量特征的一种调查方式。
适用条件
由于全面调查的范围广,工作量大,耗费大量的人力、物力和财力,且有时也不需要或不可能进行全面调查,但又要了解客观现象的总体情况,就可以采用抽样调查 。
如对一批灯泡的合格率进行调查,应该采用抽样调查方式。
总体







随机样本


五、统计调查方案的设计
调查方案的内容




调调查查对单象位
调 调查 查项 表目
调调查查时期
间限
组织实施
(一)确定调查目的
1. 调查要达到的具体目标
回答“为什么调查?”
调查之前必须明确
调查对象







调查单位?




调查对象:调查研究的总体或调查范围
调查单位:是进行调查登记的标志的承担者。是构成调查对象总体的个体单位 。
填报单位:统计调查中负责填报调查资料的单位
(二)确定调查对象、调查单位和填报单位
——即回答向谁调查、由谁提供资料
填报单位与调查单位是有区别的,填报单位可以是行政上、经济上独立的单位,也可以是人,而调查单位除此之外还可以是物。填报单位和调查单位有时一致,有时不一致。
例如:调查目的是调查某城镇居民受教育情况
调查对象、调查单位、填报单位分别是?
例如:调查机器设备的情况
那调查对象、调查单位、填报单位又分别是?
思 考
1、确定调查项目
—— 即调查什么内容
调查项目:调查的具体内容,就是调查中所要登记的调查单位的特征,是依附于调查单位(总体单位)的统计标志。
回答“调查什么?”
(三)确定调查项目和制定调查表
拟订调查项目时要注意几个原则:
- 调查项目要少而精;
- 调查项目含义要明确;
- 尽可能做到各个调查项目之间有一定的联系。
(三)确定调查项目和制定调查表
调查表:即各个调查项目按照一定的顺序排列在一定表格中形成的表格。
(三)确定调查项目和制定调查表
调查表的内容
表头:用来表明调查表的名称以及填写调查单位名称、性
质、隶属关系等。
表体:调查表的主要部分,包含栏目、计量单位等。
表脚:包含调查者(填报人)的签名和调查时间等。
一览表
在一张表上登记若干个调查单位,但调查的项目不能过多。
在一张表上登记一个调查单位,可以容纳较多的项目。
调查表分为:
(三)确定调查项目和制定调查表
单一表
要区别调查时间和调查期限的不同:
调查时间是指调查资料所属的时间(时点或时期),即所谓的客观时间,也就是调查资料所反映的现象客观存在的时间。
(四)确定调查时间和调查期限
调查期限是指进行调查工作的起讫时间。包括搜集资料和报送资料的整个工作所需要的时间。
其主要内容包括:
1、组织领导机构和参加调查的单位和调查人员的组成;
2、调查前各种准备工作,包括宣传教育、人员培训、调
查文件的准备及试点工作;
3、调查经费的预算和开支办法;
4、调查结果的提交或公布时间。
(五)制定调查的组织实施计划
第二节 统计数据的整理
一、统计整理的概念和工作程序
二、统计分组
三、分配数列
一、统计整理的概念和工作程序
统计整理,是根据统计研究目的和统计分析的要求,将统计调查所获得的原始资料进行科学的分类和汇总,或对简单加工过的资料进行再加工,使之系统化、条理化,从而得出能够反映事物总体特征资料的工作过程。
通过统计整理将社会现象的个体数量表现过渡到对总体的综合数量表现,得到描述现象总体数量特征的综合指标数值。
统计整理的工作程序:
制定统计整理方案
审核调查资料
对调查资料进行分组、汇总和计算
整理后的统计资料的再审核
将整理结果编制统计表或绘制成统计图
统计整理的工作程序
(一)统计分组的概念、作用
二、统计分组
统计分组的概念:根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。
揭露社会经济现象的类型,反映各类型的特点。
(1)类型分组
类 型 2000年 2001年 2002年 2003年
农业 13 873.6 14 462.8 14 931.5 14870.1
林业 936.5 938.8 1 033.5 1239.9
牧业 7 393.1 7 963.1 8 454.6 9538.8
渔业 2 712.6 2 815.0 2 971.1 3137.6
合 计 24 915.8 26 179.6 27 390.8 29691.8

单位:亿元
2.统计分组的作用
说明社会经济现象的内部结构。
(2)结构分组
年  份 2000 2001 2002 2003
第一产业 16.4 15.8 15.3 14.6
第二产业 50.2 50.1 50.4 52.5
第三产业 33.4 34.1 34.3 33.1
合  计 100.0 100.0 100.0 100.0

我国国内生产总值构成(%)
2.统计分组的作用
研究经济现象之间的依存关系。
(3)分析分组
耕作深度分组(cm) 地块数 平均收获率(斤/亩)
10-12 7 400
12-14 10 460
14-16 16 540
16-18 18-20 12 5 620
680

某乡某种农作物的耕作深度与收获率的关系
2.统计分组的作用
二、统计分组
(二)统计分组的原则
穷尽原则,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。
互斥原则,就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。
组内同质、组间异质原则。是把同质总体中具有不同性质的单位分开,性质相同的单位合在一起。
选择分组标志的原则
根据研究问题的目的来选择
要选择最能反映被研究现象本质特征的标志
要结合现象所处的具体历史条件或经济条件来选择
分组标志的选择
品质标志分组 —— 反映事物属性差异
1.按分组标志的特征不同分为
(1)单项式分组——以每一变量值作为一组
适用于离散型变量,变量值不多、变动范围不大。
数量标志分组 —— 反映事物数量差异
(三)统计分组的种类
(2)组距式分组——把变量值划分为几个区间
适用于变量变动幅度大、项目多的分组。
按性别分组 职工人数 绝对数 比重(%)
男 女 合计 180 120 300 60
40
100
某外贸企业职工的性别构成情况
品质标志分组
按年龄分组 职工人数 绝对数 比重(%)
20岁以下 20—30岁 30—40岁 40-50岁 50岁以上 合计 24 120 84 39 33 300 8
40
28
13
11
100
某外贸企业职工的年龄构成情况
数量标志分组
单项式分组
按数量分组 高校数 绝对数 比重(%)
1 2 3 3个以上 合计 40 120 6 4 170 23.5
70.6
3.5
2.4
100
某省高校图书馆数量情况表
家庭人均月收入 (元) 家庭户数
(户)
400以下 280
400~500 680
500~600 1800
600~700 3200
700以上 500
合计 6460
2012年某地区职工家庭人均月收入资料表
组距式分组
2.按分组标志的个数分
对社会经济现象需要从各方面进行观察和分析研究,需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。
简单分组 —— 按一个标志对总体进行分组
复合分组 —— 按两个或两个以上标志对同
一总体进行分组
(三)统计分组的种类
按性别分组 职工人数 绝对数 比重(%)
男 女 合计 180 120 300 60
40
100
某外贸企业职工的性别构成情况
简单分组
按专业技术职务分组 按年龄分组 合计
30岁及以下 31—45岁 46—60岁 61岁以上
研究员 副研究员 助理研究员 其他 80
合计
某科研机构科研人员基本情况
复合分组
(一)分配数列的概念
统计总体按照某一标志分组以后,将总体中所有单位按组归类并排列,形成总体中各个单位数在各组间的分布,称频数分布或次数分布。
次数或频数:是分布在各组中的总体单位数,通常用符号f表示。
频率:是各组次数与总次数之比。
三、分配数列

月工资分组(元) 工人数(人) 占总数比重(%)
2000 以下 210 39.6
2000-2500 187 35.3
2500 以上 133 25.1
合 计 530 100.0
组别(变量) 次数(频数) 频率
频数分布包括两个要素:
总体按某标志所分的组的名称和各组的次数或频率
频数分布满足两个条件:
即各组频率大于零,各组的频率总和等于1(100%)
按分组标志特征不同分为
品质数列
变量数列
(二)频数分布的种类
某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)
男 30 75
女 10 25
合计 40 100
组别 次数 频率
三、分配数列
某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)
男 30 75
女 10 25
合计 40 100
组别 次数 频率
品质数列
按品质标志分组形成的用来观察总体单位中不同属性的单位分布情况的数列。
三、分配数列
组距式分组
单项式分组
依据数量标志分组所编制的分配数列。
变量数列
三、分配数列
单项式变量数列

按每个变量值为一组形成的数列适用于离散型变量,
且变量值少。
三、分配数列
组限:组距数列中,各组变量值变动的界限
上限:组内最大变量值,
下限:组内最小变量值。
组距:就是上限与下限之差,
即:组距=组上限-组下限
用变量值变动的一定范围(即组距)代表一个组所形成的
变量数列。
组距式变量数列
三、分配数列
组距式数列,根据组距不同分为:
等距数列—— 各组的组距相等
适用于标志值变动比较均匀的情况下
不等距数列——各组的组距不相等
在下列情况下,就考虑采用异距分组:
1、标志值分布很不均匀的场合;
2、标志值相等的量具有不同意义的场合;
3、标志值按一定比例发展变化的场合;
三、分配数列
三、分配数列
直接将每一个变量值作为一组,汇总计算各组相应的单位数,然后利用表格形式列示即可。
单项式数列的编制
例:车间30名工人某日加工的零件个数统计如下:
30 30 28 29 30 31 29 30 29 31
29 29 30 27 30 29 28 31 29 29
30 27 27 29 30 28 29 29 30 29
要求:编制变量数列,反映工人加工零件的分布情况。
(三)变量数列的编制
(1)把30名工人加工零件的个数按照由小到大的顺序排列。
(2)进行分组。由于变量值只有27、28、29、30、31,因此,可以把每一个变量值作为一组,计算各组变量值出现的次数,按顺序加以排列,如下表所示。
加工零件数(个) 工人数(人) 比重(%)
27 3 10
28 29 30 31 3 12 9 3 10
40
30
10
合 计 30 100
30名工人某日加工零件数分布表
1.排序
将变量值按大到小的顺序排列,确定最大值、最小值,
计算全距。 全距=最大值-最小值
2.确定组距和组数
组距:组距是每个组中最大值与最小值的差。
组数:即数列分组的数目。
等距数列组数=全距÷组距
3.确定组限
组限:组限是指分组的数量界限,包括上限和下限。
上限是各组的最大变量值,下限是指各组的最小变量值。
若一组内只有上限没有下限或只有下限没有上限,称此组为开口组;上限与下限都齐全的组称为闭口组。
组距式数列的编制
具体确定组限时,要考虑以下几点:
1、第一组的下限应小于等于最小变量,最后一组的上限应大于最大变量值。
2、组限的表示方法
对于连续型变量,采用相邻两组上下限重叠的方式,即上一组的上限同时也是下一组的下限。
对于离散型变量,一般也采用连续型变量的组限表示法。
如职工的工资可分为1000元以下,1000~2000元,2000元以上。2000元的职工分哪一组呢?
上限不在内
4.计算组中值
组中值:各组中点位置所对应的变量值。
闭口组组中值:组中值=(上限+下限)÷2
当遇到开口组时,其组中值以相邻组组距为依据计算,即: 缺上限组的组中值=下限+(相邻组组距÷2)
缺下限组的组中值=上限-(相邻组组距÷2)
组距式数列的编制
若开口组的下限为2000,相邻组的组距为500,则该开口组的组中值为( )
A.2500 B.2250 C.2100 D.2200
B
将总体各单位分配到各组,计算出各组的次数。
1、向上累计:是将各组次数或频率,由变量值小的组向变量值大的组逐组累加,表示各组上限以下向包含的总体次数和比率有多少。
2、向下累计:是将各组次数或频率,由变量值大的组向变量值小的组累加,表示各组下限以上总共所包含的总体次数和比率有多少。
5.编制变量数列
组距式数列的编制
某车间50名工人日加工零件数,请编制适当的组距式数列(单位﹕件)
117 122 124 129 139 107 117 130 122 125
108 131 125 117 122 133 126 122 118 108
110 118 123 126 133 134 127 123 118 112
112 134 127 123 119 113 120 123 127 135
137 114 120 128 124 115 139 128 124 121
(1)排序
(2)确定组距和组数
等距数列组数=全距÷组距=(139-107)÷10=4组
(3)确定组限
100-110;110-120;120-130;130-140
(4)确定每个组的频数和频率
(5)必要的时候计算累计频数和频率
按零件数分组 频数(件) 频数(%) 向上累计频数 向下累计频数 向上累计频率 向下累计频率
100-110 3 6
110-120 13 26
120-130 24 48
130-140 10 20
合计 50 100
某车间50名工人日加工零件数情况表
1.钟形分布
2.U形分布
(五)次数分布的类型
3.J形分布
三、频数分布的类型
第三节 统计数据的展示
一、统计表
二、统计图
结构:
从表式上看:总标题、横行标题、纵栏标题和指标
数值四个部分
从内容上看:由主词栏和宾词栏两个部分组成。
一、统计表
(一)统计表的定义和结构
统计表:表现为经过整理的统计数据的表格。

分组 总产值(万元) 职工人数(人) 劳动生产率
(元/人)
P 1 2 3
大型
中型
小型
合计
2015年某月某公司各企业劳动生产率统计表
单位____




主词
宾词
总标题
纵栏标题
数据资料
(指标数值)
统计表的结构和内容
按主词的结构分类:简单表、分组表和复合表。
一、统计表
(二)统计表的分类
简单表:统计总体未经任何分组,仅按时序和空间罗列的统计表。
分组表:统计总体仅按一个标志进行分组的统计表。
复合表:统计总体按两个或两个以上标志进行重叠分组的统计表。
(三)统计表的编制原则
1.总标题须简明扼要表达出全表的内容;
2.各标题要确切反映表的内容,且表格安排合理;
3.指标数值要位数对齐,合计一般放在表的尾部;
4.对指标内容作必要说明时,可加注在表的下方;
5.表的上下边线(基线)用粗实线或双线,表的两边是开口式;
6.纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。
总原则:合理、科学、实用、简练、美观。
一、统计表
(一)直方图
用于展示分组数据分布的一种图形
用矩形的宽度和高度来表示频数分布
本质上是用矩形的面积来表示频数分布
在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图
二、统计图
(二)条形图
用宽度相同的条形的高度或长短来表示各类别数据的图形
有单式条形图、复式条形图等形式
绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图
直方图与条形图的区别
条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的
直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义
直方图的各矩形通常是连续排列,条形图则是分开排列
条形图主要用于展示品质数据,直方图则主要用于展示数值型数据
(三)饼图
也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形
主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题
绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定
(四)环形图
环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示
与饼图类似,但又有区别
饼图只能显示一个总体各部分所占的比例
环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环
用于结构比较研究
(五)折线图
表示时间序列数据趋势的图形
时间一般绘在横轴,数据绘在纵轴
图形的长宽比例大致为10:7
4. 一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断
谢谢

展开更多......

收起↑

资源预览