资源简介 (共48张PPT)单元一 认识统计整理单元二 了解统计分组单元三 编制分布数列单元四 绘制统计图和编制统计表单元五 Excel在统计整理中的应用项目三 统计整理项目三导学单元一认识统计整理一、统计调查的概念与意义统计资料整理,就是根据统计研究任务的要求,对统计调查所取得的各项原始资料进行科学的加工与汇总,使其系统化出能反映现象总体特征的综合资料;或对已加工过的资料(包括历史资料)进行再加工。统计整理的意义1.统计整理是从对个体现象的认识到对总体现象数量特征认识的过程。2.统计整理是调查的继续,是统计分析的前提,起承上启下的作用。3.是对现象由感性认识到理性认识的过程。统计整理是统计工作过程的重要阶段,是实现从个体单位标志值向总体数量特征值过渡的必要阶段。二、统计资料整理的步骤第一步,设计和制定统计整理方案。它是对资料整理工作的各个方面各步骤做出具体的安排与规定。第二步,对原始资料进行审核。审核被调查单位的资料是否全部收齐,填报是否缺漏与差错,发现问题,及时解决,以保证资料汇总计算能顺利进行。第三步,对经过审核的资料进行分组、汇总,计算出总体总量指标。第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。第五步,对统计资料妥善保存,系统积累。三、统计资料审核(一)预处理1、数据汇总前的审核,对统计调查取得的资料,要进行准确性 、及时性 、完整性三个方面的审核。2、资料审核后的订正(二) 汇总后审核四、统计资料汇总(一)统计资料的汇总技术1、手工汇总2、电子计算机汇总(二)统计汇总的组织形式1、逐级汇总2、集中汇总3、综合汇总单元二了解统计分组一、统计分组的概念 与意义(一)统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分。统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“合”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。9(二)统计分组的意义统计分组的目的就是要将同质总体中有差异的单位区分开来,同时又将性质相同的某些单位组合在一起,统计分组的意义主要表现在以下三个方面:(1)划分现象的类型;(2)反映总体的构成及特征;(3)研究现象之间的依存关系。分组标志的选择是统计分组的核心问题,为了保证统计分组科学合理,选择分组标志必须遵循穷尽的原则、互斥原则。同时,在选取分组标志时还要考虑:(1)根据研究的目的、任务选择分组标志(2)选择能够反映事物本质的标志分组(3)要考虑现象所处的历史条件和经济条件二、分组标志的选择1.按分组标志的性质分类统计分组可分为:(1)品质标志分组:(2)数量标志分组:2.按分组标志的多少分类统计分组可分为:(1)简单分组(2)并列分组(3)重复分组三、统计分组的分类1.确定统计分组的内容和分组体系简单分组与平行分组体系复合分组与复合分组体系2.选择分组标志3.划定组间界限三、统计分组的步骤单元三编制分布数列一、分布数列的概念与种类分布数列的概念:分布数列又称分配数列、次数分配数列,是在统计分组的基础上,将总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字。两个要素组成:(1)各组名称或各组变量值(总体按某标志分组)(2)各组单位数(次数或频数)二、分布数列的概念与种类品质分布数列变量分布数列单项式变量数列组距式变量数列分布数列等距数列异距数列 (这种数列一般比较稳定,只要分组标志确定的比较恰当,通常能准确地反映总体的分布特征。)根据分组时采用的分组标志不同,分布数列可分为:1.品质数列:按品质标志分组的数列,用来观察总体单位中不同属性的单位分布情况。2.变量数列:将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。变量数列按各组表现形式不同分为单项式变量数列和组距式变量数列。组距式变量数列相关概念(1)组限:就是每一组两端的数值。(2)上限:各组最大的变量值(3)下限:各组最小的变量值(4)组距:各组的上限与上限之差(5)组中值:每组上限与下限之间的中点数值。即组中值 = (上限值+下限值)÷2(6)全距:最大与最小的变量值之差(7)开口式组距数列组中值:缺下限组的组中值=该组上限-相邻组组距/2缺上限组的组中值=该组下限+相邻组组距/2三、分布数列的编制(一)品质数列的编制①按品质标志对总体作属性分组;②划分各组界限;③汇总各组单位数,并编制分布数列表,即得到品质数列;(二)变量数列的编制1.单项式分布数列的编制2.组距式分布数列的编制二、变量数列的编制举例 单项式变量数列的编制某工厂生产车间30人工人日产量原始数据如下: 20 21 21 24 23 22 20 21 22 23 24 20 24 21 22 22 23 24 22 21 22 23 22 21 21 22 22 23 22 23单项式变量数列直接将每一变量值作为一组,汇总计算各组相应的单位数(次数),并采用表格形式列示即可,例如表某工厂生产车间工人按日产量分布(各组变量值) (次数) (频率)日产量 工人数 比率(%)20 21 22 23 24 3 7 10 6 4 10.023.333.320.113.3合计 30 100.021组距变量数列的编制例,对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%)98 81 95 84 93 86 91 102 100 103105 100 104 108 107 108 106 109 112 114109 117 125 115 120 119 118 116 129 113第一步:计算全距。(将各变量值由小到大排序,确定某最大值,最小值,并计算全距。)81 84 86 91 93 95 98 100 100 102103 104 105 106 107 108 108 109 109 112113 114 115 116 117 118 119 120 125 129变量的最大值是129%最小值是81%全距 = 最大值 - 最小值=129% - 81%= 48%第二步:确定组数和组距组距和组数的确定没有顺序规定,即可以先根据数据的变化特征确定组数,也可以在事先对研究对象的性质比较了解的情况下,先确定组数,然后确定组距,但组数必须是整数。在等距分组时,组距与组数的关系是:本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。在等距分组时,计算组距如下:为了符合习惯和计算方便,组距近似地取10%。第三步:确定组限第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。第四步:编制频数(频率)分布表。计算本例中各组的频数(工人数)和频率,编制某企业30个工人劳动定额完成情况的分布表某企业30个工人劳动定额完成情况分布图表劳动定额完成程度(%) 频数(人) 频数(%)80—90 90—100 100—110 110—120 120—130 3 4 12 8 3 10.013.340.026.710.0合计 30 100.0第五步:计算累计频数和累计频率为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率数列。累计频数和累计频率有向上累计频数(频率)和向下累计频数(频率)两种。向上累计数:小于各组的该组上限的各组的频数或频率之和;相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。向下累计数:大于及等于该组下限的各组的频数或频数或频率之和。根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表。劳动定额完成情况(%) 频数 (人) 频率 (%) 向上累计 向下累计频数 (人) 频率 (%) 频数 (人) 频率(%)80~90 90~100 100~110 110~120 120~130 3 4 12 8 3 10.0 13.3 40.0 26.7 10.0 3 7 19 27 30 10.0 23.3 63.3 90.0 100.0 30 27 23 11 3 100.090.076.736.710.0合计 30 10.0 — — — —单元四绘制统计图和编制统计表统计表的概念:统计表是以纵横交叉的线条所形成的表格来表现统计资料的形式;是统计用数字说话的一种常用形式。统计表的作用:1.能有条理地、系统地显示数据,使人们阅读时一目了然,印象深刻;2.能合理地、科学地组织数据,便于人们阅读时对照比较;3.具有容量大、方便计算等优势;一、统计表Page 30统计表的概念以纵横交叉的线条所形成的表格来表现统计资料的形式;是统计用数字说话的一种常用形式。一、统计表统计表作用1)能将统计资料系统条理化,使资料显得紧凑、简明、醒目2)便于检查数字的准确性与完整性3)具有容量大、方便计算等优势4)是分析研究的工具(一)从统计表的形式看:总 标 题纵栏标题横行标题 数字资料1)总标题:是统计表的名称、表头。放在表上方说明统计表的主要内容2)横行标题:是各组的名称。反映总体单位的分组情况3)纵栏标题:是统计指标的名称。说明纵栏所列的各项资料4)数字资料:也称指标数值,是统计表的具体内容,每一数值位于相应纵横栏交叉处。此外,如资料来源、指标注释等附件资料放表下方二、统计表的结构(二)从统计表的内容看统计表包括主词和宾词两部分。纵栏标题:主词: 数据资料宾词主词宾词列于表的纵栏用来说明主词的各个指标,包括指标名称、指标数值、指标单位主词列于表的横行要说明的总体及总体的各单位、各组的名称,或各个时期。统计表的种类简单表 主词未经过任何分组,反映出总体各单位的名称或按时间顺序简单排列,或同时反映以上内容的统计表。分组表 主词按照一定标志分组的统计表,也称简单分组表。复合表 主词按照两个或两个以上的标志层叠分组所形成的统计表。四、统计表的编制原则合理安排表的结构(行、列标题位置,表的长度比例)选择合适的总标题,(简明、确切概括统计表的内容)主词栏与宾词栏要各归其位,相互对应;如果表中数据必须注明计量单位:若数据用同一计量单位,则单位可以放右上角;否则应放在指标后括号内或另起一列;表中数据一般右对齐,有小数时以小数点位置对齐;数据栏不能有空白。没有数字用“—”表示;栏数多时,可在各列的文字标题下面设置编号加以标识;表的上、下端用粗线或双线封口,左右两端一般不封口;列标题之间用细线隔开,行则不要求;必要时在表的下方加注释、资料来源等。(一)统计图的概念统计图是以图形形象地表现统计资料的一种形式。用统计图表现统计资料,具有具有直观、醒目、生动、易于理解等特点。因而绘制统计图是统计整理的重要内容之一。二、统计图(二)统计图的种类常用的统计图主要有直方图、条形图、折线图、曲线图、饼图、环形图。(一)直方图和条形图直方图:是用矩形的宽度和高度乘积来表示次数分布的图形直方图( Histogram )用于显示连续型变量的次数分布条形图:是用宽度相同的条形的高度或长度表示数据次数的图形条形图(Bar)一般用于显示离散型量的次数分布两者区别:条形图:用条形的长度或高度表示各类别数量的多少,宽度固定直方图:用面积表示数量的多少(二)折线图和曲线图折线图:是在直方图的基础上把相邻直方形的顶边中点连接成一条折线。曲线图:当变量数列的组数无限多时,折线图就近似地表现为平滑的曲线,称为曲线图。折线图、曲线图主要用于显示连续型变量的次数分布和现象的动态变化折线图曲线图曲线图是用曲线的升降起伏来表示被研究现象的变动情况及其趋势的图形。曲线图根据所示数据的性质和作用不同,可分为频数分布曲线图、动态曲线图和依存关系曲线图。(三)饼图和环形图饼图:又称圆形图,是以圆的面积或扇形面积的大小来表示数值大小或总体内部结构的一种图形。环形图:环形图是用环中的一段表示总体各部分数据大小的图形。环形图可同时绘制多个数据系列。用于显示定类变量的分布情况圆形图(饼图 Pie )环形图用于显示定类量的次数分布单元五Excel在统计整理中的应用一、Excel编制分布数列(一)使用数据透视表编制品质数列1.单击自定义快速访问工具栏的“数据透视表”按钮,在弹出的“创建数据透视表”窗口,选择要分析的数据区域,单击“确定”按钮。2.在“数据透视表字段列表”中选择行、列、数值字段,左侧报表区域将生成按性别分组的数据透视表。(二)使用频数函数(FREQUENCY)编制频数分布表(1)输入数据(2)数据排序(3)确定分段点(每组上限):统计结果“上在内下不再”(4)确定频数放置区域(先选定)(5)计算频数:插入/函数/统计/FREQUENCY , ctrl+shift+enter(6)计算频率,频数分布表的文字添加、输入。(三)使用数据分析工具编制频数分布表数据/数据分析/直方图 (如果“数据”下面没有“数据分析”,其他命令/加载项 调出“数据”项)“直方图”对话框中的“接收区域”是指分组标志所在的区域,此处输入每组的上限值。打开“数据分析”对话框输入数据打开“直方图”对话框。二、Excel绘制统计图(1)将表中数据输入Excel。(2)绘制统计图。单击“插入”菜单,选择“图表”选项卡中的图表类型。(3)统计图的布局设置。可以根据需要对初步绘制的统计图进行修改设置。如添加数据标签,增加图标标题,设置次要坐标轴等。项目小结1.统计整理。统计整理是根据统计研究任务的目的要求,对调查所搜集到的大量、零星分散的原始资料进行审核,分组、汇总,使其条理化、系统化、规范化,变成能反映总体特征的综合资料的工资过程,或对二手资料进行再加工的工作过程。2.统计资料审核审核。主要包括资料的完整性、准确性和及时性三个方面。3.统计分组。4.分布数列。分布数列是在分组的基础上,将总体的所有单位按组归类形成总体单位在各组间的分布。又称分配数列、次数分配数列,简称分布数列。分布数列的构成:(1)各组名称或各组变量值(总体按某标志分组);(2)各组单位数(次数或频数)5.组距式分布数列的编制步骤。①将原始资料按大小排序,确定总体中的最小值、最大值及全距;②确定编制数列的类型;③确定组数和组距;④确定组限;⑤计算各组次数和比重,编制分布数列表;6计算累计频数和累计频率;6.统计表和统计图。 展开更多...... 收起↑ 资源预览