第3章 -统计数据整理 课件(共43张PPT)-《应用统计学(第2版)》同步教学(电子工业版)

资源下载
  1. 二一教育资源

第3章 -统计数据整理 课件(共43张PPT)-《应用统计学(第2版)》同步教学(电子工业版)

资源简介

(共43张PPT)
《应用统计学》第三章
统计数据整理
应用统计学
CONTENTS
目录
第一节 统计数据整理概述
第二节 数据预处理
第三节 统计分组
第四节 统计图表
应用统计学
第一节 统计数据整理概述
应用统计学
一、 统计整理的意义:
统计整理是根据研究的目的和任务,对调查阶段所收集到的大量原始资料进行科学的分类、汇总,为统计分析提供能描述现象总体数量的综合特征的工作过程。
应用统计学
二、统计整理的程序:
审核和订正原始资料
根据研究目的设计整理汇总方案
编制各种统计图表
应用统计学
三、统计数据汇总的形式:
手工汇总
计算机汇总
应用统计学
第二节 数据预处理
应用统计学
数据预处理
数据审核
数据筛选
数据排序
检查数据中的错误
计算检查和逻辑检查
找出符合条件的数据
升序和降序
寻找数据的基本特征
应用统计学
第三节 统计分组
应用统计学
一、统计分组的意义和作用:
1、统计分组的意义
统计分组是根据统计研究的需要,将统计总体按照一定的标志区分为有联系的组成部分的一种统计分析方法。
统计分组使组与组之间具有差别性,而同组内的单位保持相对的同质性。
应用统计学
2、统计分组的作用:
从不同角度区分现象的类型,可以表明统计总体的基本性质和特征
刻画现象总体的内部结构及其特征
分析各类现象之间的依存关系
应用统计学
简单分组
复合分组
品质分组
变量分组
01
02
按分组标志的性质不同
按分组标志的多少
02
质量指标
类型分组
结构分组
分析分组
03
二、统计分组的种类:
按分组标志的作用不同
应用统计学
实例:学生按性别、学历层次的简单分组
男生
学生
女生
研究生
学生 本科生
专科生
应用统计学
实例:学生按性别、学历层次的复合分组
研究生
男生 本科生
专科生
学生
研究生
女生 本科生
专科生
应用统计学
三 、统计分组的方法
1、按品质标志分组
按品质标志分组,有些分组比较简单,分组标志一经确定,组的名称和组数也随之确定,如人口按性别只能分为男、女两组。
有的品质分组比较复杂,组与组之间的界限难以确定,如人口按职业分组,这类标志分组的详细程度一般要根据分析任务的要求,经过事先研究并规定统一划分标准,编制统一分类目录作为分组的统一依据。
应用统计学
三 、统计分组的方法
2、按数量标志分组
按数量标志分组,应注意以下两个问题:
一是分组时各组数量界限的确定必须能反映事物质的差别。
二是应根据现象总体的数量特征,采用适当的分组形式,确定相宜的分组及组限。
应用统计学
变量数列的种类和编制
单项式变量数列是每一个组只有一个变量值的变量数列(如表3-1)
组距式变量数列是将变量的取值范围划分为若干个区间,以一个变动区间为一个组的变量数列。(如表3-2)
应用统计学
表3-1 某企业3月份工人日产量表
日产量(件) 工人人数(人) 比重(%)
3 10 8.7
4 15 13.0
5 30 26.1
6 40 34.8
7 20 17.4
合计 115 100.0
应用统计学
表3-2 某班学生《统计学》考试成绩表
成绩(分) 频数(人) 频率(%)
60以下 2 6.7
60-70 4 13.3
70-80 9 30.0
80-90 11 36.7
90以上 4 13.3
合计 30 100
应用统计学
数据分组的步骤:
排序
求全距(极差=最大值-最小值)
组数
斯特格斯(Sturges)经验公式:组数K=1+log10N/log102=1+3.322lgN
频数分布表
确定各组组限
计算频数
分组形式
确定变量的形式
(单项式分组、组距式分组)
组距
组距=极差/组数=(最大值-最小值) /组数
应用统计学
实例:
某生产车间50名工人日加工零件数如下(单位:个)。对数据进行分组。
117 122 124 129 139 107 117 130 122 125
108 131 125 117 122 133 126 122 118 108
110 118 123 126 133 134 127 123 118 112
112 134 127 123 119 113 120 123 127 135
137 114 120 128 124 115 139 128 124 121
应用统计学
单项式分组
表3-3 某车间50名工人日加工零件数分组表 零件数 (个) 频数 (人) 零件数 (个) 频数 (人) 零件数 (个) 频数
(人)
107 108 110 112 113 114 115 117 118 1 2 1 2 1 1 1 3 3 119 120 121 122 123 124 125 126 127 1 2 1 4 4 3 2 2 3 128 129 130 131 133 134 135 137 139 2
1
1
1
2
2
1
1
2
应用统计学
组距式分组
极差=最大值-最小值=139-107=32
K=1+3.322lgN=1+3.322×lg50≈7
组距=极差/组数=32 /7=4.6 ≈5
应用统计学
组距式分组
表3-4 某车间50名工人日加工零件数分组表 按零件数分组 频数(人) 频率(%)
105~110 110~115 115~120 120~125 125~130 130~135 135~140 3 5 8 14 10 6 4 6
10
16
28
20
12
8
合计 50 100
应用统计学
数据分组与频数分布的注意点
03
04
01
02
连续型变量:习惯上规定上组限不在内
离散型变量:两组组限间断的办法
“不重不漏”原则
空白组与开口组
等距与不等距分组
组中值
开口组通常以相邻组的组距为组距
频数密度=频数/组距
(单位组距内分布的频数)
组中值=(上限+下限)/2
缺上限的组中值=下限+邻组组距/2,
缺下限的组中值=上限-邻组组距/2
应用统计学
表3-5 离散变量组距数列
商店按职工人数分组(人) 商店数(个)
1——5 6——10 11——15 16——20 21——25 9
13
31
9
5
合计 67
实例:
应用统计学
表3-6 某车间50名工人日加工零件数分组表
(将最小值改为96,最大值改为160 按零件数分组 频数(人) 频率(%)
95~100 100~105 105~110 110~115 115~120 120~125 125~130 130~135 135~140 140~145 145~150 150~155 155~160 160~165 1 0 2 5 8 14 10 6 3 0 0 0 0 1 2
0
4
10
16
28
20
12
6
0
0
0
0
2
合计 50 100
实例:
应用统计学
表3-7 某车间50名工人日加工零件数分组表 按零件数分组 频数(人) 频率(%)
110以下 110~115 115~120 120~125 125~130 130~135 135以上 3 5 8 14 10 6 4 6
10
16
28
20
12
8
合计 50 100
实例:
应用统计学
累计频率
向上累计是将各组频数和频率,由变量值小的组向变量值大的组逐组累计。每组累计的频数、频率表明各组上限以下总共包含的总体次数和比率有多少。
向下累计是将各组频数和频率,由变量值大的组向变量值小的组逐组累计。每组累计的频数、频率表明各组下限以上总共包含的总体次数和比率有多少。
应用统计学
表3-8 某班学生《统计学》考试成绩表
成绩(分) 频数(人) 频率 (%) 向上累计频数(人) 向上累计频率(%) 向下累计频数(人) 向下累计频率(%)
60以下 2 6.7 2 6.7 30 100.0
60-70 4 13.3 6 20.0 28 93.3
70-80 9 30.0 15 50.0 24 80.0
80-90 11 36.7 26 86.7 15 50.0
90以上 4 13.3 30 100.0 4 13.3
合计 30 100 --- --- --- ---
实例:
应用统计学
第四节 统计图表
应用统计学
一、统计表的概念
狭义的统计表是将调查得来的说明总体数量特征的经过汇总整理后的数字资料,按照一定的指标顺序填列在一定的表格内,这个表格就是统计表。
广义的统计表是以纵横线条交叉结合成的表格,用来表现统计资料的一种形式。
应用统计学
统计表由主词和宾词两部分构成。
主词是统计表所研究总体及其各个组成部分。
宾词是说明总体的统计指标。
统计表包括
总标题
横行标题
纵栏标题
数字资料
01
02
从统计表的形式看
从统计表的内容看
二、统计表的结构:
应用统计学
实例:
应用统计学
表3-11 2022年中国国内生产总值及构成
按产业分组 国内生产总值 总数(亿元) 比重(%)
第一产业 88345 7.30
第二产业 483164 39.92
第三产业 638698 52.78
合计 1210207 100
三、统计表设计
应用统计学
1、统计表表式设计注意事项:
(1)设计为长方形表格
(2)线条的绘制
(3)合计栏的设置
(4)栏数的编号
三、统计表设计
应用统计学
2、统计表内容设计注意事项
(1)标题设计
(2)指标数值
(3)计量单位
(4)注明资料来源
01
折线图
02
03
曲线图
04
05
饼图
条形图
直方图
用宽度相同的条形的高度和长度表示次数分布
用圆形及圆内扇形的面积来表示次数分布
横坐标,按照顺序表示不同的区间(组),用矩形条,表示相应区间数据的频次或频率。
把直方图顶部的中点用直线连接起来,再把原来的直方图抹掉,折线图的两个终点要与横轴相交
当变量数列的组数无限增加时,折线近似表现为一条平滑曲线
四、统计图的类型
应用统计学
实例:
从某城市抽出30个商店,某商品的价格数据
9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 10.06 10.01
10.03 9.99 9.97 9.93 10.01 10.03 10.03 10.02 10.05 9.99
9.95 9.96 9.98 10.00 9.97 10.01 10.00 9.99 9.98 10.00
可以选用那种统计图来描述数据的特征?
应用统计学
应用统计学
实例:
某生产车间50名工人日加工零件数如下(单位:个)。用统计图描述数据特征。
117 122 124 129 139 107 117 130 122 125
108 131 125 117 122 133 126 122 118 108
110 118 123 126 133 134 127 123 118 112
112 134 127 123 119 113 120 123 127 135
137 114 120 128 124 115 139 128 124 121
应用统计学
135


(人)
15
12
9
6
3
105
110
115
120
125
130
140
日加工零件数(个)
30
24
18
12
6
%
135
140
日加工零件数(个)
15
12
9
6
3


(人)
105
110
115
120
125
130
应用统计学
曲线图的类型(钟型、U型、J型)
对称曲线
右偏曲线
左偏曲线
U型曲线
正J型曲线
反J型曲线
应用统计学
谢 谢
应用统计学

展开更多......

收起↑

资源预览