第3章 数据的整理与显示 课件(共37张PPT)-《统计学基础》同步教学(东北财大版)

资源下载
  1. 二一教育资源

第3章 数据的整理与显示 课件(共37张PPT)-《统计学基础》同步教学(东北财大版)

资源简介

(共37张PPT)
第3章 统计数据的整理与显示
学习目标
本章介绍统计数据整理的预处理过程、统计分组的概念和方法、频数分布及变量数列的编制方法以及统计表与统计图的结构和绘制方法。
3.1 统计数据的预处理
3.1.1 数据的审核
完整、准确 适用、时效
3.1.2 数据的筛选
剔除 保留
3.1.3 数据的排序排序
递增、递减 升序、降序
数据的审核—原始数据(raw data)
完整性审核
应调查的单位或个体是否有遗漏
所有的调查项目或变量是否填写齐全
准确性审核
数据是否真实反映实际情况,内容是否符合实际
数据是否有错误,计算是否正确等
数据的审核——二手数据
(second hand data)
适用性审核
弄清楚数据的来源、数据的口径以及有关的背景材料
确定数据是否符合自己分析研究的需要
时效性审核
尽可能使用最新的数据
确认是否有必要做进一步的加工整理
数 据 的 筛 选
(data filter)
将某些不符合要求的数据或有明显错误的数据予以剔除
将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除
数 据 的 排 序
(data rank)
分类数据的排序
字母型数据,排序有升序降序之分,但习惯上用升序
汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分
数值型数据的排序
递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)递减排序:可表示为:x(1)>x(2)>…>x(n)
3.2 统计数据的整理
3.2.1 统计分组的概念和作用
1)统计分组的概念
2)统计分组的作用
(1)区分事物性质,划分现象类型(类型分组)
(2)反映现象的内部结构(结构分组)
(3)分析现象之间的依存关系(相关分组)
3.2.2 统计分组的分类和方法
1)统计分组的分类
(1)按分组标志的多少划分
简单分组 复合分组
(2)按分组标志的类型划分
品质分组 数量分组
(3)按分组的作用划分
类型分组 结构分组 分析分组
2)统计分组的方法
(1)单项式分组(数值型数据)
(2)组距式分组(数值型数据)
例:某高中学生年龄分布表
年龄(岁) 学生数 比率(%)
16 100 10.31
17 200 20.62
18 240 24.74
19 210 21.65
20 220 22.68
合计 970 100.00
例:某企业职工按工资分组表
月工资分组(元) 职工人数 比重(%)
1000-1500 120 10.00
1500-2000 280 23.33
2000-2500 500 41.67
2500-3000 200 16.67
3000以上 100 8.33
合计 1200 100.00
组距式分组有关概念
分组的原则——不重复不遗漏
连续变量分组,临组限重叠;
离散变量分组,临组限间断。
一组的最小值叫下限 一组的最大值叫上限
组中值=(上限+下限)/2
开口组组距按邻组计算
等距分组 异距分组
等距分组的步骤、方法
1)确定组数。
斯特格斯(Sturges)经验公式: k=1+3.322lgN
2)确定组距。
组距=(最大值-最小值)/组数
异距分组(频数密度=频数/组距)
3)确定组限。
最低组下限小于最小值,最高组上限大于最大值。
例:某车间50名工人日加工零件数
117 122 124 129 139 107 117 130 122 125
110 118 123 126 133 134 127 123 118 112
108 131 125 117 122 133 126 122 118 108
112 134 127 123 119 113 120 123 118 112
137 114 120 128 124 115 139 128 124 121
50名工人分组步骤
1、确定组数k=1+3.322lg50≈7
2、计算组距=(139-107)/7=4.6≈5
3、确定组限,编制频数分布表
工人日加工零件频数分布表
按零件数分组 工人数 频率(%)
105-110 3 6
110-115 5 10
115-120 8 16
120-125 14 28
125-130 10 20
130-135 6 12
135-140 4 8
合计 50 100
3)累计频数和累计频率(定序、定距、定比数据))
例:某高校抽查50名学生月平均通信费分布
月平均通信费(元) 频数 频率(%) 向上累计 向下累计 频数 频率 频数 频率
15以下 4 8 4 8 50 100
15~23 8 16 12 24 46 92
23~31 15 30 27 54 38 76
31~39 6 12 33 66 23 46
39~47 7 14 40 80 17 34
47~55 6 12 46 92 10 20
55以上 4 8 50 100 4 8
合计 50 100 — — — —
例: 某银行窗口服务态度统计表(定序数据)
服务态度 服务人次 向上累计 频数 向下累计
频数
很不满意 3 3 70
不满意 9 12 67
满意 27 39 58
很满意 31 70 31
合计 70 — —
3.3 统计数据的显示
3.3.1 统计表
1)统计表的结构
形式:表头、列标题、行标题、数字资料、表 外附加
内容:主词、宾词
统计表的结构
2002—2003年城镇居民家庭抽样调查资料 项目 单位 2002年 2003年
调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业面 平均一名就业者负人数 平均每人全部年收入 可支配收入 平均每人消费性支出 户 人 人 % 人 元 元 元 45317 3.04 1.58 51.97 1.92 8177.40 7702.80 6029.88 48028
3.01
1.58
52.49
1.91
9061.22
8472.20
6510.94
资料来源:《中国统计年鉴2004》,中国统计出版社,2004,第359页。 注:本表为城市和县城的城镇居民家庭抽样调查资料。 行标题
列标题
数字资料
表头
附加
2)统计表的分类
简单表、分组表、复合表
3)统计表的设计
合理安排统计表的结构
总标题内容应满足3W 要求
数据计量单位相同时,可放在表的右上角标明,不同时应 放在每个变量后或单列出一列标明
表中的上下两条横线一般用粗线,其他线用细线
通常情况下,统计表的左右两边不封口
表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一
对于没有数字的表格单元,一般用“—”表示
必要时可在表的下方加上注释
1)定性数据的图形描述
(1)条形图(bar graph)
横置条形图 (条)
纵置条形图 (柱)
(2)饼形图(pie chart)
(3)环形图
3.3.2 统计图
购买饮料品牌
【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次 。右边就是记录的原始数据。
绿色
健康饮品
购买饮料品牌条形图
对比条形图
购买饮料品牌饼图
环形图
8%
36%
31%
15%
7%
33%
26%
21%
13%
10%
非常不满意
不满意
一般
满意
非常满意
甲乙两城市家庭对住房状况的评价
2)定量数据的图形描述
(1)直方图(histogram)
(2)折线图(line)
(3)茎叶图(stem-and-leaf display)
(4)线图
(5)雷达图
例:某企业职工某项食品月支出表
月支出(元) 职工数(人) 比重(%)
200以下 20 20
200-400 50 50
400-600 20 20
600-800 10 10
合计 100 100
职工生活费支出直方图和折线图
折线图与直方图
下的面积相等!
例:某企业50名应聘者回答问题的正确数
112 73 126 82 92 115 95 84 68 100
72 92 128 104 108 76 141 119 98 85
69 76 118 132 96 91 81 113 115 94
97 86 127 134 100 102 80 98 106 106
107 73 124 83 92 81 106 75 95 119
茎叶图
6  9 8
7 2 3 6 3 6 5
8 6 2 3 1 1 0 4 5
9 7 2 2 6 2 1 5 8 8 5 4
10 7 4 8 0 2 6 6 0 6
11 2 8 5 9 3 5 9
12 6 8 7 4
13 2 4
14 1
6 8 9
7 2 3 3
8 0 1 1 2 3 4 5 6
9 1 2 2 2 4 5 5 6 7 8 8
10 0 0 2 4 6 6 6 7 8
10 2 3 5 5 8 9 9
12 4 6 7 8
13 2 4
1
直方图与茎叶图的区别
例:某地区2010—2017年人均收支记录(元)
表3-21 某地区2010—2017年人均收支记录 单位:元
年份 2010 2011 2012 2013 2014 2015 2016 2017
人均 收入 1700.6 2026.6 2577.4 3496.2 4283.0 4838.9 5160.3 5425.1
人均 支出 708.6 784.0 921.6 1221.0 1577.7 1926.1 2091.1 2162.0
某地区2010—2017年人均收支记录线图
雷达图—多变量数据
本章小结
1、针对统计调查收集的统计数据进行简单预处理和整理
2、运用统计分组的方法进行资料整理,并能够编制分组数列
3、根据分组资料编制统计表和绘制统计图,包括常见的饼图、条形图、直方图等。
THANKS

展开更多......

收起↑

资源预览