第2章 数据的搜集与整理 课件(共53张PPT)-《应用统计学》同步教学(电工版)

资源下载
  1. 二一教育资源

第2章 数据的搜集与整理 课件(共53张PPT)-《应用统计学》同步教学(电工版)

资源简介

(共53张PPT)
第2章数据的搜集与整理
我们生活在信息时代,
我们生活在信息时代,
我们生活在信息时代,
信息的主体就是统计。
信息的主体就是统计。
第2章 
2.1 数据的测量尺度与常用类
2.2 统计数据的搜集
2.3 统计分组
2.4 分配数列
2.5 统计表
2.6 Stata软件入门、画图和制表
第2.1节 数据的测量尺度与常用类
第2.2节 统计数据的搜集
第2.3节 统计分组
第2.4节 分配数列
第2.5节 统计表
第2.6节 Stata软件入门、画图和制表
 数据的搜集与整理
第2章
掌握数掌握数据的测量尺度及常用类型;
了解统计数据搜集的意义;
掌握统计分组、分配数列的编制方法;
掌握数据图表展示方法。
本章教学目的
第2章 数据的搜集与整理
第2章
统计分组、分配数列的编制方法
数据图表展示方法
本章重点和难点
第2章 数据的搜集与整理
第2章
2.1.1 数据的测量尺度
2.1.2 统计数据的常用类型 数据的测量尺度
2.1.2 统计数据的常用类型
2.1 数据的测量尺度与常用类型
第2章
1.名义数据:反映研究对象类别的数据。
例如,汉族用1表示,其他民族用0表示;男性用1表示,女性用0表示,这些数字代码只具有示意性质,不能直接进行数值运算。
2.顺序数据:对研究对象进行分类的结果,分类的结果呈现一定的层级性和顺序关系。
例如,表示一个人的受教育程度,可以分为小学、初中、高中、大学、研究生五个层次;表示消费者对产品或服务的满意程度,可以分为很不满意、不满意、一般、满意、很满意五个层次;表示学生学习成绩,可以分为不及格、及格、中等、良好、优秀五个层次。
2.1.1 数据的测量尺度
2.1 数据的测量尺度与常用类型
3.定距数据:定距数据反映了研究对象的数量特征,通常也称为区间类别数据或等距数据,可以用数值表示。
例如,在某次智商测试中,A得了140分,B得了120分,C得了100分,在对三个人的智商进行比较时,我们可以说A的智商高于B的智商,B的智商高于C的智商,还可以说A和B之间的智商差距与B和C之间的智商差距是一样的。
4.等比数据:等比数据与定距数据一样,拥有相等的单位,不同的是,等比数据有绝对的零点。等比数据表明了量的大小。
例如,A销售员某月的销售额是20万元,B销售员的销售额是10万元,可以说A的销售额是B的销售额的两倍。通过上例可以看出,等比数据不但可以进行加减运算,而且还可以进行乘除运算。
2.1.1 数据的测量尺度
第2章
2.1 数据的测量尺度与常用类型
第2章
1.绝对数、相对数和平均数
绝对数是数据最基本的表现形式,是其他数据指标形成的基础。
相对数反映了研究对象的相对水平,由两个相互联系的绝对数的对比而得到。
平均数反映了研究对象的总体表现水平,是一个抽象了的研究对象总体各单位在某一数量标志下的表现差异,表示研究对象的总体各单位的一般水平,而不是某个单位的具体水平。
2.1.2 统计数据的常用类型
2.1 数据的测量尺度与常用类型
第2章
2.横截面数据、时间序列数据和面板数据
横截面数据是指在某一时点上反映一个总体的一批个体的同一特征变量的观测值;
时间序列数据是指在不同时点上收集到的统计数据,反映研究对象随时间变化而改变的状态;
面板数据又称平行数据,是指在时间序列上选取多个截面,同时选取样本观测值所组成的样本数据。
2.1.2 统计数据的常用类型
2.1 数据的测量尺度与常用类型
第2章
3.一手数据和二手数据
一手数据又称原始统计数据,是指针对研究对象直接搜集的、没有经过加工整理的原始状态的数据。
二手数据又称次级数据或间接数据,是指为了某种研究目的而采用的已经整理加工过的数据。
2.1.2 统计数据的常用类型
2.1 数据的测量尺度与常用类型
第2章
2.2.1 一手数据的搜集
2.2.2 二手数据的搜集
2.2  统计数据的搜集
2.2.1 一手数据的搜集
1.调研数据
调研方案的设计需要注意以下几个方面:确定目的和任务;确定调研对象;拟定调研提纲;设计调研表;
确定调研时间和调研地点;制订调研实施计划。
2.观察数据
利用这种研究方法时,调研人员在自然状态下或在一定的实验条件下观察研究单位并记录相关的信息,由此获得的数据称为观察数据。
3.实验数据
实验通常用来研究变量间的因果关系,在实验中控制若干个变量,然后记录相应的实验数据,并根据数据结果对变量间的因果关系进行检验。
2.2.1 一手数据的搜集
第2章
2.2  统计数据的搜集
第2章
二手数据是已经存在并经过他人整理分析过的资料。获取二手数据的主要渠道有国家统计部门、各级政府相关部门的公开数据,行业协会提供的发展数据,调研公司的统计资料,以及学术会议、期刊、报纸、书籍等。
2.2  统计数据的搜集
2.2.2 二手数据的搜集
第2章
2.3.1 统计分组的概念及作用
2.3.2 统计分组的方法
2.3 统计分组
第2章
统计分组是指依据研究的目的和需要将统计总体按照一定的标志划分为若干个组成部分的统计方法。统计分组的目的是将总体中不同特征的单位分开,将总体中相同特征的单位合在一起,以保持统计资料的一致性和差异性,方便进一步的统计研究,从而揭示事物的规律性和本质特征。
2.3 统计分组
2.3.1 统计分组的概念及作用
第2章
统计分组作用1.区分社会经济现象的类型
2.3.1 统计分组的概念及作用
2.3 统计分组
第2章
统计分组作用2.研究社会经济现象的内部结构
2.3.1 统计分组的概念及作用
2.3 统计分组
第2章
统计分组作用3.研究社会经济现象的依存关系
2.3.1 统计分组的概念及作用
2.3 统计分组
第2章
统计分组三个基本原则:
唯一性原则:每次对总体进行分组时只能依据一个标志进行分组;
周延性原则:分组后各个分组的单位数总和与总体的单位数相同;
互斥性原则:各组之间存在相互排斥关系,体现出一定的差异性。
2.3.2 统计分组的方法
2.3 统计分组
第2章
分组标志的选择:
根据研究目的选择分组标志。
选择最能反映总体本质特征的标志。
结合性原则。随着时间、地点、情境的变化,社会经济现象也会发生变化。
2.3.2 统计分组的方法
2.3 统计分组
第2章
分组标志的种类:
品质标志分组。按照品质标志分组是指选择能够反映社会经济现象本质特征和事物属性的标志作为分组标志,并在品质标志变化区间范围内确定各个分组的界限,将研究总体分为若干个组别。
数量标志分组。数量标志分组是指选择能体现数量差异标志作为分组标志进行的分组,在数量的变化区间内划分各个组别的界限,将研究总体划分为性质不同的若干组成部分。
2.3.2 统计分组的方法
2.3 统计分组
第2章
简单分组、复合分组和分组体系:
简单分组。简单分组是指对研究总体只按照一个标志进行分组。
2.3.2 统计分组的方法
2.3 统计分组
第2章
简单分组、复合分组和分组体系:
复合分组。复合分组是指对统计总体按照两个或两个以上的标志进行分组。分组一般采用层叠式或交叉式。
例如,2019年我国高等教育学校(机构)数,采用了交叉式的分组方式,如书中表2-5所示。
2.3.2 统计分组的方法
2.3 统计分组
第2章
2.4.1 分配数列的概念及分类
2.4.2 分配数列的编制
2.4.3 品质分配数列的表示方法
2.4.4 数量分配数列的表示方法
2.4  分配数列
第2章
 分配数列是指将统计总体中所有单位按组别进行归类整理、按照一定顺序进行排列,进而形成的各个单位在各个组间的分布。
分配数列具有两个基本要素:按照某种标志进行分组的组别和各个组别所分布的单位数量。
 
2.4  分配数列
2.4.1 分配数列的概念及分类
第2章
根据所采用分组标志的性质,可以将分配数列分为品质数列和数量数列。 
品质数列是指按照品质标志对统计总体进行分组而形成的分配数列,也可以称为属性分配数列。
2.4  分配数列
2.4.1 分配数列的概念及分类
第2章
如果按照数量标志进行分组而得到的分配数列则称为变量数列。变量数列又可划分为单变量数列和组距变量数列。变量数列也包括两个基本要素:各个组别的变量值和各个单位在每个组别上出现的次数。
2.4  分配数列
2.4.1 分配数列的概念及分类
第2章
2.4.2 分配数列的编制
1.单变量数列的编制
单变量数列又称单项数列,即数列各个分组的变量值只有一个,每组都用同样的变量不同的数值进行表示,如表2-6所示。通常情况下,如果变量个数是有限个且能以整数进行表示时则编制单变量数列。
2.4  分配数列
第2章
2.4.2 分配数列的编制
2.组距变量数列的编制
在变量数值较多的情况下,一般采用组距变量数列的编制方法,这种方法是将全部变量数值按顺序划分为若干个区间,同时将这个区间的变量数值范围作为组别标志。
2.4  分配数列
第2章
2.4.2 分配数列的编制
2.组距变量数列的编制
编制组距变量数列步骤:
确定组数。数据总体分为多少组比较合适与数据本身的特征及数据数量的多少有直接关系。
确定组距。各个分组的上限与下限的差值即为组距,一般可以将数据总体的最大值和最小值之间的差值与组数相除来确定,即组距=(最大值-最小值)÷组数。
整理频数分布表。根据数据分组情况整理数据的频数分布,如以学生成绩为分组标志对学生统计学成绩进行频数分布统计。
2.4  分配数列
第2章
1.列表法
2.4  分配数列
2.4.3 品质分配数列的表示方法
第2章
2.图示法
(1)条形图。条形图是指用宽度相同、高度不同的条形来表示数据变化的图形。条形图可以横向展示,也可以纵向展示,纵向展示时又称柱形图。
2.4.3 品质分配数列的表示方法
2.4  分配数列
第2章
2.图示法
(2)饼图。饼图是用圆形及圆形面积的大小来表示数据数值大小的图形。饼图通常用来表示研究总体中各个组成部分的比例分布,对于结构性的研究问题非常实用。
2.4.3 品质分配数列的表示方法
2.4  分配数列
第2章
1.列表法
列表法是指用统计表的形式将分配数列的内容进行展示。为了方便问题的研究和各种指标的运算,一般会列入频数累计和频率累计。
2.4  分配数列
2.4.4 数量分配数列的表示方法
第2章
2.图示法
(1)直方图。直方图是用长方形的高度、宽度来展示频数或频率分布情况的图形。在坐标系中,横轴表示数据的分组情况,纵轴表示各个分组的频数或频率情况,数据分组与对应的频数或频率就构成了一个长方形,就是直方图。
2.4  分配数列
2.4.4 数量分配数列的表示方法
第2章
2.图示法
(2)折线图。折线图是在直方图基础上画出来的,把直方图各个长方形顶部的中点用直线连接起来,将折线图两边与横轴相交,具体做法是将第一个和最后一个长方形顶部中点与对应长方形左边或右边竖线的中点相连,延伸至与横轴相交为止。
2.4  分配数列
2.4.4 数量分配数列的表示方法
第2章
2.5.1 统计表的概念及构成
2.5.2 统计表的分类
2.5.3 统计表设计要求
2.5  统计表
第2章
统计表是一种直观展现统计数据的最常用形式。将调研数据资料整理汇总后,将系统化的统计资料按照一定逻辑顺序列示在一个表格内,就会形成统计表。
统计表是调研数据整理和分析的工具,广义上的统计表包括统计工作各个阶段形成的所有表格,如调研表、整理表、计算表等,都是用来提供统计资料的重要工具。
 
2.5  统计表
2.5.1 统计表的概念及构成
第2章
统计表从内容上来看,可以分为主词和宾词两部分,如表2-11所示,主词是统计表所要说明的主体内容,它是各个分组数据的名称,宾词包括各项指标的名称和具体的数值。 
2.5.1 统计表的概念及构成
2.5  统计表
第2章
1.简单表
统计表的主词没有经过任何分组的表称为简单表,简单表的主词一般按照时间顺序或各个单位名称顺序排列。简单表一般是对调研获取资料初步整理所采用的形式,如表2-12所示。
 
2.5.2 统计表的分类
2.5  统计表
第2章
2.分组表
统计表的主词按照某种标志进行分组后所形成的表称为分组表,利用分组表可以展示统计总体不同现象的特征,说明各个分组之间的内部结构和相互关系,如表2-13所示。
 
2.5.2 统计表的分类
2.5  统计表
第2章
3.复合表
统计表的主词按照两个或两个以上的标志进行分组的表称为复合表,如表2-14所示。 
2.5.2 统计表的分类
2.5  统计表
第2章
统计表的标题应能简明地概括统计表的内容;
统计表中的主词和宾词一般按照从局部到总体的顺序排列
统计表中必须标明数据资料的统计单位;
统计表中的数据要横向和纵向对齐,即使统计数据相同,也不能用“同上”等字样表示,需要重复相同的数据;
统计表一般都为开口表,即表的左右两侧不绘制纵向线段,表的上下用加粗线段封口;
为了方便统计表的引用和核实,统计表还应加上附注,说明数据资料来源、符号意义等情况,并标示在统计表下边的右侧。
 
2.5.3 统计表的设计要求
2.5  统计表
第2章
2.6.1 Stata软件入门
2.6.2 Stata画图和制作统计表
2.6 Stata软件入门、画图和制表
第2章
1.为什么使用Stata软件
Stata软件因其操作简单且功能强大,成为目前在欧美国家最流行的统计与计量分析软件,拥有为数众多的用户。Stata公司也通过定期升级软件来适应计量经济学的迅猛发展。同时,Stata软件留有“用户接口”,允许用户自己编写命令与函数,并上传到网上实现共享。 
2.6 Stata软件入门、画图和制表
2.6.1 Stata软件入门
第2章
2.Stata软件的窗口
 
2.6 Stata软件入门、画图和制表
2.6.1 Stata软件入门
第2章
3.Stata软件操作实例
导入数据。
变量的取值类型。
变量的标签:在变量窗口,每个变量的名字旁边都显示了其标签。
审视数据:如果想查看数据集中的变量名称、标签等,可输入命令:.describe ;如果想查看变量的具体数据,可输入命令:.list。
生成新变量:在Stata软件中定义新变量,可通过命令generate来实现。
计算器功能:Stata软件也可作为计算器使用,其命令格式为“display expression”。
Stata软件的日志:在进行实证研究时,有时会得到很多结果,这些结果虽然显示在屏幕上,但退出Stata软件后结果将丢失。
 
2.6 Stata软件入门、画图和制表
2.6.1 Stata软件入门
第2章
1.直方图
看数据的直观方法是画图,可使用命令:
.histogram varname [if] [in] [weight] [, [continuous_opts | discrete_opts] options]
2.6 Stata软件入门、画图和制表
2.6.2 Stata画图和制作统计表
第2章
2.统计表
在Stata的命令操作中,使用table和tabulate命令可以实现对定性变量的频数和频率的统计。例如,
.table year
tabulate一维命令还有一个配套的方便工具—tab1,在其后可以添加多个变量,Stata软件会对每个变量创建一维表格,相当于多次执行tabulate命令。tab1的结构如下:
.tab1 varlist [if][in] [weight] [,tab1 options]
2.6 Stata软件入门、画图和制表
2.6.2 Stata画图和制作统计表
第2章
3.散点图
绘制散点图的命令如下:
[twoway] scatter varlist [if][in [weight][,options]
实际上,以下3种形式都是Stata软件可以识别的scatter语句:
.graph twoway scatter ...
.twoway scatter ...
.scatter ...
2.6 Stata软件入门、画图和制表
2.6.2 Stata画图和制作统计表
第2章
1.某公司某年9月末有职工250人,10月上旬的人数变动情况是:4日新招聘12名大学生上岗;6日有4名老职工退休离岗;8日有3名青年工人应征入伍,同日又有3名职工辞职离岗;9日招聘7名营销人员上岗。试计算该公司10月上旬的平均在岗人数。
做一做
第2章
2.下表是某保险公司160名推销员月销售额的分组数据,计算并填写表格中各行对应的向上累计频数和向下累计频数。
做一做
The End

展开更多......

收起↑

资源预览