03第三章统计整理 课件(共62张PPT)-《统计学(第三版)》同步教学(高教版·2020)

资源下载
  1. 二一教育资源

03第三章统计整理 课件(共62张PPT)-《统计学(第三版)》同步教学(高教版·2020)

资源简介

(共62张PPT)
《统计学》课件
第三章 统计整理
教学目的与要求
通过本项目学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。
教学重点与难点
重点:分组标志的选择; 连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理解权数。
难点:组距分组中组数、组距和组限的确定。
本章的主要内容
☆ 统计整理的意义和步骤
★ 统计分组方法
☆ 次数分布(分配)数列
★ 统计表的绘制
第一节 统计整理的意义和步骤
※ 统计整理的地位
统计调查 统计整理 统计分析
一、统计整理的意义
搜集原始资料
对个体的感性认识
分类、汇总
过渡阶段
取得研究结论
对总体的理性认识
※ 统计整理的概念
根据目的 对统计调查资料 实施分类、汇总
编制统计图表 为统计分析奠定基础
国家统计局网址:http://www.stats./tjzs/tjbk/201502/t20150212_682790.html应用
二、统计整理的步骤
制订整理方案
审核调查资料
具体实施整理
复查整理结果
编制统计图表
1
3
4
4
2
5
统计整理的步骤(续)
★ 制订整理方案:主要内容有:
统计分组体系和统计指标体系;
编制整理表格和填表说明;
整理的组织形式和汇总的技术方法。
★ 审核调查资料:审核内容包括:
调查资料的完整性和正确性。
审核方法:逻辑检查和计算检查。
★ 绘制统计图表:统计资料表现形式(参见以下图表例)
家庭户规模 家庭户 一代户 二代户 三代户 四代户 五代及
户 数 以上户
总 计 401934196 137363112 192237846 69562135 2768189 2914
一人户 58396327 58396327
二人户 97947686 75218232 22729454
三人户 107978654 2463294 102050486 3464874
四人户 70598493 742461 51256083 18527039 72910
五人户 40332512 352069 12249841 27233357 497183 62
六人户 16887554 83923 2692507 13118985 991806 333
七人户 5753970 37656 786951 4212526 716033 804
八人户 2235271 23272 272183 1657839 281117 860
九人户 942511 11050 102349 713749 114900 463
十人及以上户 861218 34828 97992 633766 94240 392
2010年全国不同规模的家庭户类别
六次普查家庭户规模:4.33;4.43;4.41;3.96;3.44;3.10以及DINK家庭等问题。
2013—2017年我国人口数及其构成(公报数字)
指 标 年末数(万人) 比重(%)
2013 2015 2017 2013 2015 2017
总人口 136072 137462 139008 100.0 100.0 100.0
城镇 73111 77116 81347 53.7 56.1 58.52
乡村 62961 60346 57661 46.3 43.9 41.48
男性 69728 70414 71137 51.2 51.2 51.2
女性 66344 67048 67871 48.8 48.8 48.8
0-15岁 23875 24166 24719 17.5 17.6 17.8
16-59岁 91954 91096 90199 67.6 66.3 64.9
60岁及以上 20243 22200 24090 14.9 16.1 17.3
65岁及以上 13161 14386 15831 9.7 10.5 11.4
2018年年末人口数及其构成
指标 年末数(万人) 比重(%)
全国总人口 139538 100.0
其中:城镇 83137 59.58
乡村 56401 40.42
其中:男性 71351 51.1
女性 68187 48.9
其中:0-15岁(含不满16周岁) 24860 17.8
16-59岁(含不满60周岁) 89729 64.3
60周岁及以上 24949 17.9
其中:65周岁及以上 16658 11.9
第二节 统计分组
一、统计分组的意义
☆ 统计分组: 根据统计研究的需要,将总体按一定的标志划分为若干性质不同的组成部分的统计方法。
☆ 两个涵义: 对总体而言是“分”,
对个体而言是“合”。
质量标准: 组内同质性 组间差异性
统计分组的主要作用
对社会经济现象进行类型划分
统计分组过程就是类型划分的过程。划分类型,揭示差异是统计分组的根本作用
对社会经济现象进行结构分析
反映总体内部结构,判定现象性质及变化。研究对象的性质往往由内部结构决定;性质的变化往往又是内部结构变化引起的
研究社会经济现象间的依存关系
分析影响因素和结果之间的变动关系及规律。 (分类计算,分析量在类之间在变化关系)
2019年全国居民人均消费支出及其构成
二、统计分组的两个关键问题
(一)选择分组标志(首要问题)
选择分组标志
的原则
①根据研究目的
③具体问题具体分析(略)
②选择主要标志(略)
(二)划分各组界限(年龄,65)
在选定分组标志后,就需要明确组与组之间的界限。
三、统计分组体系
简单分组:对总体只按一个标志分组。
平行分组体系:两个及以上标志分别分组
统计分组体系:运用多个分组标志对同 一总体进行分组形成的一系列相互联系、相互补充的统计分组的整体。
复合分组体系:两个及以上标志层叠分组
平行分组体系(人口分组为例)
性别


年龄
0-15
16-64
65以上
户籍
城镇
农村
平行分组体系适宜对研究对象进行
多角度、多方面分析。
复合分组体系(人口分组为例)
城镇
农村




0-15
16-64
65以上
0-15
16-64
65以上
0-15
16-64
65以上
0-15
16-64
65以上
复合分组体系适宜对研究对象 进行
多层次逐层深入分析
四、统计分组的种类及方法
统计分组
变量分组
品质分组
单项分组
组距分组
等距分组
异距分组
2018年年末人口数及其构成
指标 年末数(万人) 比重(%)
全国总人口 139538 100.0
其中:城镇 83137 59.58
乡村 56401 40.42
其中:男性 71351 51.1
女性 68187 48.9
(一) 品质分组(实例)
(二)变量分组
变量分组反映的是各组量的差别,通过量的差别来反映事物间的性质差别。
1.单项分组
每组只用一个具体的变量值来表示的分组。其组数由不重复的变量值个数决定;各组组值明确且为整数值。适用于不重复的变量值个数不多的离散变量。
2、组距分组
各组用变量值的变动区间来表示。适用于连续变量和不重复的变量值个数很多的离散变量。
(1)几个基本概念:
组限:(下限、上限)
闭口组:下限、上限都有。如16——64
开口组:
下开口组: ××以下
上开口组: ××以上
为什么要设开口组?
统计分组的原则:“不漏不重” (穷尽和互斥)。即:
(1)要使总体中的每个单位都有组可归,贯彻分
组的“穷举”原则;即:“不遗漏”原则。
在出现极端值情况下,为了遵循统计分组的原
则,应设置开口组解决极端值归组问题。
(2)在按照某个标志分组时,一个单位只能归到某
一组,不能重复归组; 即“互斥”原则。
全距=最大值—最小值
组距=上限—下限 (此处板书成绩和年龄分组待用)
(注意:开口组组距以邻组组距代替)实例:
组距分组(续2)
学生成绩分组
60以下
60-70
70-80
80-90
90以上
职工工资分组
2000以下
2000-3000
3000-4000
4000-5000
5000以上
年龄
0-15
16-64
65以上
组距和组数的关系
组数与组距的确定,要力求能够将总体分布的特点反映出来。由于全距是既定的,在等距分组情况下,组距和组数存在相互制约的关系:
需要注意:根据上式计算的只能是一个参考数。
资料:现有某地区500个企业的计划完成 程度资
料,其中最低83%,最高125%,全距为42%。
据本资料可确定组数为6,则计算出的组距为7,分组结果为(1)。观察以下三种分组结果:
★若先确定组数-----实例讨论
先确定组数-----实例讨论
分组结果(1)
83% ----90%
90%---97%
97%---104%
104%--111%
111%---118%
118%---125%
分组结果(2)
83%-----93%
93%-----103%
103%-----113%
113%-----123%
123%-----133%
分组结果(3)
80%----90%
90%----100%
100%----110%
110%----120%
120%----130%
分组结果(2)
83%-----93%
93%-----103%
103%-----113%
113%-----123%
123%-----133%
组距和组数确定了,并不意味着分组结果的唯一确定。
以上两种分组结果,虽然都是组距为10,组数为5,但由于组限不同,分组结果
就不一样。组限也是组距分组的重要问题。
★组限及其表示方法
第三节 次数分布(配)数列的编制
一、次数分布(分配)数列概念及构成
次数分布(分配)数列:是指在统计分组的基础上,将总体各单位进行归组整理编制而成的一种反映总体单位在各组之间分配状况的统计数列。


①各组组别
②单位数(频数、次数)
③比重(频率)
构成
要素
【课堂讨论1】
讨论目的:认识权数的作用;
比较绝对数权数和相对数权数的作用差别
资料(1)现有甲乙两个班的某学期考试的成绩。
成绩 甲 班 乙 班
人数 比重% 人数 比重%
及 格
不及格 7
63 10
90 63
7 90
10
合 计 70 100 70 100
甲乙两班的英语学习成绩表
【课堂讨论2】
资料(2):现有A、B两个不同股份公司的甲、乙两股东所持本公司股份如下表。若甲、乙都是所在公司第一大股东。甲掌握本公司2000万股份,而乙只掌握本公司120万股份。
要求:判断甲、乙在本公司的决定权大小。
股东 A公司 B公司
股份数(万) 比重% 股份数(万) 比重%


… 2000
… 4
… …
120
… …
60

总股份 50000 100 200 100
二、次数分布(分配)数列的种类
次数
分布
等距
数列
变量
数列
品质
数列
单项
数列
组距
数列
异距
数列
某校学生性别构成
性别 人数(人) 比重(%)

女 250
530 32.1
67.9
合计 780 100.0
某村农户按子女数分组
品质数列
子女数 户数 比率%
0
1
2
3 10
90
60
40 5
45
30
20
合计 200 100
次数
频率
变量数列
组别
组距数列的编制(实例)
资料:现有2018年某班50名学生9月份人均月消费支出(元)资料如下:
822 794 773 737 898 827 798 776 746 811 855 740 775 796 867 824 882 729 764 788 735 771 791 819 860 726 762 786 809 852 1520 722 760 784 940 930 689 659 380 803 700 753 781 801 829 712 857 781 803 832
可以看出这些资料很凌乱,难以直接判断其分布特征。
根据该资料编制组距数列
(该习题包括了组距数列需要处理的全部问题)
综合题:根据数列,计算月平均消费支出及标准差
组距数列的编制实例(续1)
第一步:按顺序排列变量值;
第二步:计算全距;
变量值在380-1520之间,全距为1140。由于
380和1520为极端值,计算全距可不予考虑。可用
开口组表示;则全距=940-659=281
第三步:确定组距或组数;
若分6组,则组距=281/6=46.8 ,组距设为
50;若分4组,则组距设为100。组距太小不能反映收入水平的差异,若先考虑组距,100更合适。
组距数列的编制实例(续2)
人均月
消费支出(元) 人数(人) 比重
(频率)%
700以下
700-750
750-800
800-850
850-900
900以上 3
9
17
11
7
3 6
18
34
22
14
6
合 计 50 100
某班50名学生人均月消费支出表
组距数列的编制实例(续3)
人均月消费支出(元) 人数
(次数) 比重
(频率)%
700以下
700-800
800-900
900以上 3
26
18
3 6
52
36
6
合计 50 100
某班50名学生人均月消费支出表
对以上两种组距数列进行比较可以看出:表(1)反映情况比较详细。
三、累计次数和累计频率
向下累计:将各组次数和频率由变量值大的组向变量值小的组逐项累计,各组累计数表明各组下限以上的累计次数和累计频率。
向上累计:将各组次数和频率由变量值小
的组向变量值大的组逐项累计,各组累计
数表明各组上限以下的累计次数和累计频
率。
累计次数和累计频率(实例1)
成绩 人数 频率
% 向上累计 向下累计
人数 频率% 人数 频率%
60以下
60-70
70-80
80-90
90以上 4
5
15
22
4 8
10
30
44
8 4
9
24
46
50 8
18
48
92
100 50
46
41
26
4 100
92
82
52
8
合计 50 100 - - - -
某班英语考试成绩表
累计频数和累计频率(实例2)
累计频数和累计频率亦可用于品质数列,如:
累计频数和累计频率(实例3)
某县农民家庭户按年人均纯收入累计次数和累计频率表
农户按人均年纯收入分组(元) 农 户 数 向上累计 向下累计
累 计 次 数 累计
频率% 累 计 次 数 累计
频率%
1000以下
1000—2000
2000—3000
3000—4000
4000—5000
5000—6000
6000以上 36
74
223
260
208
157
42 36
110
333
593
801
958
1000 3.6
11.0
33.3
59.3
80.1
95.8
100.0 1000
964
890
667
407
199
42 100.0
96.4
89.0
66.7
40.7
19.9
4.2
合 计 1000 — —
2017年高考一分一段分段表(向下累计应用)

四、次数分布的主要类型
各种不同性质的现象有着各自特殊的次数分布。概括起来主要有三种:钟形(正态与偏态)、 U形和J形(正J与反J)分布。如下图:
洛伦兹分布
基尼系数在0-1间
低于0.2绝对平均;
0.2-0.3比较平均;
0.3-0.4相对合理;
0.4-0.5差距较大;
0.6以上差距悬殊。
世界银行测算我国:
1978年为0.330
1995年为0.455
2002年为0.454
第四节 统计表
国家统计局网址:http://www.stats./tjzs/tjbk/201502/t20150212_682790.html
2017年人力资源和社会保障统计公报
http://www.mohrss./ghcws/BHCSWgongzuodongtai/201805/t20180521_294290.html
民政部近年《社会服务统计公报》
http://www.mca./article/sj/tjgb/
一、统计表的作用
统计表:是用表格来系统显示统计资料的一种基本形式。统计表是重要和有效的统计资料表现形式。
广义的统计表包括统计工作各个阶段的一切表格,包括调查表、整理表和分析表。统计整理表是表明前述资料整理的结果,又是后续资料分析工作的开始。
统计表的作用:通过对统计资料有条理地组织与安排,使枯燥杂乱的统计数字资料系统清晰,直观易懂,鲜明、形象和生动,一目了然。统计表内的数字组织科学,排列有序,便于阅读和对照比较。统计表还是分析研究各指标之间的数量关系,进行统计分析的有效工具。
二、统计表的构成
从统计表的表式结构看,统计表包括:
总标题、横行标题、纵栏标题和数字资料四个部分。
从统计表的内容看,统计表由主词和宾词
两部分组成。
2018年我国三次产业产值构成表
产业类型 绝对数(亿元) 比重(%)
第一产业
第二产业
第三产业 64734
366001
469574 7.2
40.6
52.2
合 计 900309 100.0
总标题
纵栏 标题
横 行 标 题
数 字 资 料
主 词
宾 词
三、统计表的分类
统计表
分析表
对主词的
分组情况
按性质
整理表
调查表
按作用
空间数列表
时间数列表
复合分组表
简单分组表
平行分组表
简单表
分组表
时空数列结合表
四、统计表的设计------宾词的配置
在设计统计表时,除对主词是否分组外,对宾词也要根据分析问题的祥略要求,进行合理配置。
宾词配置的三种形式:
简单配置、平行配置、复合配置
企业名称 合计 男 女
四通
百利 856
357 663
140 193
217
合计 1213 803 410
2017年四通和百利公司职工性别分布表
单位:人
统计表宾词的配置---简单配置
简单配置:在对宾词指标不再要求细分的情况下,将各项指标按主次
顺序作简单排列。
宾词平行配置是对宾词指标进行几种简单分组以后在表中平行编排。如:
企业
名称 工人
总数 性 别 工 龄
男 女 5年以下 5-10年 10年以上
甲 (1) (2) (3) (4) (5) (6)
四通
百利 856
357 663
140 193
217 519
120 212
180 125
57
合计 1213 803 410 639 392 182
某地两企业工人的性别和工龄分布表 单位:人
统计表宾词的配置 ---平行配置
宾词复合配置:对宾词指标复合分组以后在表中层叠配置。如下表:
某地两企业工人的工龄和性别分布表 单位:人
企业
名称 工 人 工 龄
5年以下 5~10年 10年以上
男 女 计 男 女 计 男 女 计
甲 (1) (2) (3) (4) (5) (6) (7) (8) (9)
四通
百利
32 78
56
合计
统计表宾词的配置 ---复合配置
统计表的设计规则
一般原则:科学、实用、简明、美观。
注意事项:
1、标题简明 2、左右开口
3、线条清晰 4、基线加粗
5、标明单位 6、数字照齐
7、排列有序 8、编写序号
9、布局合理 10、表外注释
先分后总或先总后分均可;无数字空格“——”,缺数字空格“……”;
列多要编写序号便于查找和反映数字计算关系;
《统计整理》知识结构图

展开更多......

收起↑

资源预览