3统计整理 课件(共47张PPT)- 《统计学理论与实务》同步教学(人民邮电版)

资源下载
  1. 二一教育资源

3统计整理 课件(共47张PPT)- 《统计学理论与实务》同步教学(人民邮电版)

资源简介

(共47张PPT)
*
*
第三章 统计整理
(sorting data)
第一节统计整理的意义
一、 统计整理的意义
1、概念:根据统计研究任务的要求,对调
查所搜集到的原始资料进行分组、汇总,使
其条理化、系统化的工作过程,就是统计整
理。实质:去粗取精、去伪存真、由此及彼、
由表及里。
*
*
2、意义:
统计整理在整个统计研究中占有重要
的地位。统计整理包括对原始资料和次级
资料的整理。 统计整理是统计调查的继续,
是统计分析的前提和基础,在整个统计工
作中发挥着承上启下的作用。
*
*
二、统计整理的步骤
1、对统计调查资料进行审核
2、编制统计汇总方案
3、根据统计汇总方案,进行实际汇总工作,
并进行有关计算
4、再一次进行审核
5、编制统计图表
*
*
第二节统计分组
一、统计分组的意义
1、概念:
根据统计研究任务的要求和现象总体的内在
特点,把统计总体按照某一标志划分为若干性质
不同而又有联系的几个部分,称为统计分组。 把统计总体的各个单位按照一个或几个标志
划分为若干部分,使同一性质的单位集中起来即
“组(合)”,不同性质的单位区分开来即“分”,以
便形成“组内同质性,组间差别性”的分组效果。
*
*
2、意义
(1)区分社会经济现象的类型
亦称类型分组。由于社会经济现象的复
杂性,客观上存在着各种不同的社会类型,
利用统计分组,就能根据统计研究的目的,
将现象区分为各种性质不同的类型,来研究
各类现象的数量差异和特征以及相互关系。
例如(下表)
*
*
企业经济类型
(品质标志) 资金利润率%
(被分组指标)
国有
集体
其他 5.2
4.8
7.6
全市工业 5.6
某地区工业资金利润率的类型差别情况
从上表可以看出,其他所有制的工业企业指标最好。国有企业次之,集体企业最差。
*
*
(2)反映经济现象的内部结构
亦称结构分组。现象内部的结构,表明
现象内部的组成状况和比率关系。利用统
计分组,计算出各组数值在总体中所占的
比重,对其进行内部结构研究,来说明现
象的基本性质和特征。同时,对现象内部
结构的变化进行动态研究,还可以反映总
体现象发展变化的过程、趋势和规律。
*
*
企业经济类型
(分组标志) 产值(亿元)
(被分组指标)
国有
集体
其他 75
40
29
全市工业 144
某地区工业企业经济类型产值结构情况
反映了该市工业企业经济类型的产值结构状况
*
*
(3)揭示经济现象的相互依存关系
亦称分析分组。社会经济现象之间都
存在着不同程度的相互联系、相互制约的
依存关系。利用统计分组,可以从数量上
揭示出现象之间的这种依存关系。即分析
现象中的影响因素和被影响因素,结合分
组,来观察影响因素对被影响因素作用的
程度和方向。
*
*
商店按销售额分组(万元) 商店数(个) 商品流通费用率(%)
100以下
100—300
300—500
500—700
700—900
900以上 10
12
11
9
8
6 9.8
8.7
7.5
6.5
5.8
5.4
从表中可以看出,随着商品销售规模的扩大,其流通费率在相应降低,两者表现出负依存关系。
*
*
二、 统计分组的方法
统计分组的关键在于选择分组标志和确定各组
的界限。
1、分组标志的选择:
分组标志,即将同质总体区分为不同组的标准或
依据。分组标志的选择是统计分组的关键。分组标
志一旦选定,就必然突出了总体在该标志下的性质
差别,其他的差别看不见了。分组标志选择不当,
不但无法显示现象的根本特征,甚至会混淆事物的
性质,歪曲社会经济的真实情况。
*
*
正确选择分组标志的要求:
(1)必须根据统计研究的任务及其目的来
选择分组标志;
(2)必须选择最能反映现象本质区别和内
在联系的标志作为分组标志;
(3)必须结合现象所处的具体历史条件和
经济条件动态地选择分组标志。
*
*
2、正确确定各组的界限
分组标志确定后,就可以进一步在分组
标志的变异范围内,具体划分各组的界限。
分组标志按其形式的不同,可分为品质
标志和数量标志。统计总体可按品质标志分
组,也可按数量标志分组。
*
*
(1) 选择 品质标志分组的方法
按品质标志分组即选择反映事物属性差异的品
质标志作为分组标志进行分组,当分组标志一旦
确定,组名称和组数就确定,不存在组与组之间
的界限区分的困难。有些复杂的品质标志分组可
根据统一规定的划分标准和分类目录进行。
*
*
按数量标志分组,其变量有两种类型:离散型变
量和连续型变量。
离散变量指所描述对象的数量特征可以按一定次
序一一列举它的数值;连续变量指所描述的数量特
征在一个区间里可以有无限个数值,无法一一列举。
根据这两种变量的不同特征,在分组时,对离散变
量,如果变量值的变动幅度小,就可以一个变量值
对应一组,称单项式分组。如居民家庭按儿童数或
人口数分组,均可采用单项式分组。
(2)选择数量标志分组的方法
*
*
*
*
离散变量如果变量值变动幅度很大,变量值个数很
多,则把整个变量值依次划分为几个区间,各个变量
值则按其大小确定应归并的区间,区间的距离称为组
距,这样的分组称为组距式分组。
就是说,离散变量根据情况既可用单项式分组,也
可用组距式分组。在组距式分组中,相邻组既可以有
确定的上下限,也可将相邻组的组限重叠。
连续变量由于不能一一列举其变量值,只能采用
组距式的分组方式,且相邻的组限必须重叠。如以
总产值、商品销售额、劳动生产率、工资等为标志
进行分组,就只能是相邻组限重叠的组距式分组。
*
*
年 龄
人 数
0—2
30
3—6
87
7—16
141
17—25
248
26—40
473
41—60
415
>60
98
合计
1492
*
*
3、统计分组的种类:
按分组标志的性质分为品质分组和变量分组。(如前面所讲)
按分组标志的多少分为简单分组和复合分组。简单分组:只选择一个分组标志进行的分组;复合分组:选择多个分组标志进行的分组,并且层叠在一起。
*
*
4、统计分组体系:
统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。
分组体系有平行分组体系和复合分组体系两种。平行分组体系是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系;复合分组体系就是选择多个分组标志层迭起来的分组形成的体系。
*
*
平行分组体系:
选择多个分组标志进行多次的简单分组。
所有制 规模 行业
工业企业
国有及国有控股
集体企业
股份制企业
┅┅
大型企业
中型企业
小型企业
机械
电子
化工
冶金
*
*
复合分组体系:
选择多个分组标志层叠起来进行的分组
工业企业
国有及国有控股
集体企业
股份制企业
┅┅
所有制 规模 行业
大型企业
中型企业
小型企业
机械
电子
化工
冶金
┅┅
*
*
1、按经济类型的划分:可分为:内资:国有、集
体、股份合作、联营、有限责任、股份有限、私
营、个体、其他内资;港澳台商投资;外商投资等经济类型。
2、按三次产业的划分:第一产业:农业;第二
产业:工业;第三产业:第一层次:流通部门;
第二层次:为生产、生活服务的部门;第三层次:
为提高科学文化水平和居民素质服务的部门;第
四层次:社会公共服务的部门
统计工作中常用的分组(类):
*
*
3、国民经济行业或部门分类:
共16个门类,再依次分为92个大类、368个中类和846个小类,形成四级分类:
1)农林牧渔 2)采掘业 3)制造业 4)电力、煤气及自来水业 5)建筑业 6)地质勘查、水利管理业 7)交通运输、仓储及邮电通信业 8)批发和零售贸易)餐饮业 9)金融、保险业 10)房地产业 11)社会服务业 12)卫生、体育和社会福利业 13)教育、文艺及广播电影电视业14)科学研究和综合技术服务业 15)国家、政党机关和社会团体 16)其他行业
*
*
4、按机构部门的分类:
(1)非金融企业部门;(2)金融企业部门;(3)政府部门;(4)居民住户。
其他分类如两大生产部类的划分、两大生产领域的划分、大中小型企业的划分、职业的划分等,在此不一一讲述。
*
*
第三节分配数列
一、分配数列的概念和种类  
1、概念:在统计分组的基础上,把总体
的所有单位按组归并排列,形成总体中各个
单位在各组间的分布,称为分配数列。
分配数列包括两个要素:总体按某标志
所分的组和各组所占有的单位数。
*
*
2、分配数列的种类:
根据分组标志的不同,分配数列可以分为
品质分配数列和变量分配数列。变量分配数
列又有单项式数列和组距式数列之分,与变
量分组分为单项式分组和组距式分组是一致
的。组距式分组又可分为等距分组与不等距(异距)分组。
*
*







单项式
组距式
等距
不等距



组距式
等距
不等距








*
*
二、变量数列的编制
①将原始资料按其数值大小重新排列   只有把得到的原始资料按其数值大小重新排列顺
序,才能看出变量分布的集中趋势和特点,为确定全
距、组距和组数作准备。  ②确定全距   全距是变量值中最大值和最小值的差数。确定全
距,主要是确定变量值的变动范围和变动幅度。如果
是变动幅度不大的离散变量,可以编制单项式变量数
列,如果是变量幅度较大的离散变量或者是连续变量,
就要编制组距式变量数列。
*
*
 ③确定组距和组数   1.要尽量能反映出总体单位的分布情况及总体单位的集中趋势;
2.要尽可能区分出组与组性质上的差异。
组距数列有等距和不等距之分,应视研究对象的
特点和目的而定。组距的大小和组数的多少,是互
为条件和互相制约的。当全距一定时,组距大,组
数就少;组距小,组数就多。
*
*
在实际应用中,组距应是整数,最好是5或
10等的整倍数。在确定组距时,必须考虑原始资
料的分布状况和集中程度,注意组距的同质性,
尤其是对带有根本性的质量界限,绝不能混淆,
否则就失去分组的意义。在等距分组条例下,存
在以下关系:
组数=全距/组距
*
*
 ④确定组限   组限要根据变量的性质来确定。如果变量值相
对集中,无特大或特小的极端数值时,则采用闭口
式,使最小组和最大组也都有下限和上限;反之,
如果变量值相对比较分散,则采用开口式,使最小
组只有上限(用“XX以下”表示),最大组只有下
限(用“XX以上”表示)。在采用闭口式时,应做
到最小组的下限低于最小变量值,最大组的上限高
于最大变量值,但不要过于悬殊。 
*
*
⑤编制变量数列  经过统计分组,明确了全距、组距、
组数和组限以后,就可以把变量值归类排
列,最后把各组单位数经综合后填入相应
的各组次数栏中。
*
*
例 某地区80户居民消费支出情况
单位:元
*
*
组距=该组的上限-该组的下限
斯特奇斯的经验公式(H.A.Sturges)
开口组组限的确定:向下开口组下限为该组上限减去相邻组组距;向上开口组上限为该组下限加上相邻组组距。
*
*
频率的性质:
*
*
*
*
80
*
*
三、次数分布的主要类型:
1、各种不同性质的社会现象的次数分布主要有四种类型:
钟型分布:两头小、中间大,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。
向左偏态
向右偏态
*
*
正J型图
反J型图
U型分布:两头大、中间小,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多
*
*
洛伦茨分布(M.Lorenz)
洛伦茨分布曲线是专门用以鉴定社会收入分配的平等程度。
收 100


计 A
百 B
分 0 100
数 家 庭 累 计 百 分 数
*
*
20世纪初意大利经济学家基尼(C.Gini)
根据洛伦茨曲线找出了判断分配平等程度的指
标。设实际收入分配曲线和收入分配绝对平等
曲线之间的面积为A,实际收入分配曲线右下
方的面积为B。并以A除以A+B的商表示不平
等程度。这个数值被称为基尼系数或称洛伦茨
系数。
*
*
如果A为零,基尼系数为零,表示收入分配完全
平等;如果B为零则系数为1,收入分配绝对不平
等。该系数可在零和1之间取任何值。收入分配越
是趋向平等,洛伦茨曲线的弧度越小,基尼系数也
越小,反之,收入分配越是趋向不平等,洛伦茨曲
线的弧度越大,那么基尼系数也越大。如果个人所
得税能使收入均等化,那么,基尼系数即会变小。
联合国有关组织规定:若低于0.2表示收入绝对平
均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;
0.4-0.5表示收入差距较大;0.6以上表示收入差距
悬殊。
*
*
第四节统计表
一、统计表的结构
把汇总结果的资料按一定的规则在表格上表
现出来,这种表格叫统计表。(广义上,任何用
以反映统计资料的表格都是统计表)
统计表和统计图都是系统地表述数字资料的基
本形式
统计表的构成:
1、从外表形式上看:总标题、横行标题、纵栏标题、数字资料
2、从内容上看:主词(列在表的左方)
宾词(列在表的右方)
*
*
二、统计表的种类
1、按主次的结构,即主词是否分组和分组的程度,分为简单表、分组表和复合表
简单表是主词未经任何分组的统计表
分组表是主词按某一标志进行分组的统计表,分组表用来揭示现象不同类型的不同特征,研究总体的内部构成,分析现象之间的依存关系。
复合表是主词按两个或两个以上标志进行复合分组的统计表。
三、宾词指标的分组配置
1、平行配置:指宾词栏中各分组标志彼此分开,各标志的分组指标做平行排列。
2、层叠配置:指将各分组标志层叠在一起,使各标志的分组指标有较大的增多。
*
*
四、统计表的编制原则
1、统计表的各种标题,特别是总标题的表达,应该十分简明确切,概括地反映出表的基本内容。
2、表的主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总计。
3、如果统计表的栏数较多,通常要编号。
4、表中数字应该填写整齐,对准位数。
5、统计表中必须注明数字资料的计量单位。
6、必要时,统计表应加注说明或解释。
7、表格形式为有上下端线,左右开口式。
*
*
例:某企业工人日产量资料如下(单位:件)
要求:1、指出上述变量数列属于哪一种变量数列?这个数列说明什么问题?
2、指出统计表中的变量、变量值、上限、下限、次数、频率、总体单位总数
3、计算组距和各组组中值
日产量分组 工人数 日产量分组 工人数
60以下 6 90—100 15
60—70 9 100—110 18
70—80 12 110—120 20
80—90 14 120以上 8

展开更多......

收起↑

资源预览