资源简介 (共41张PPT)第三章 统计数据的整理学习目的及重难点提示本章学习目的了解数据整理在统计活动中的地位、数据整理的内容、数据审核与汇总的技术。领会统计分组的概念、关键、统计分组体系及次数分布的类型和特征。明确统计数据的表现形式——统计表和统计图的基本内容。掌握统计分组、分配数列和统计图表的编绘制方法。 本章重难点提示本章重点:统计分组、变量数列的编制、统计数据的显示方法——统计表和统计图。本章难点:统计分组、变量数列的编制、次数分布图的绘制。第一节数据整理的一般问题一、数据整理的概念和作用(一)概念对统计调查所搜集到的数据进行分类和汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。(二)作用统计数据整理,是统计调查的继续,也是统计分析的前提,承前启后,在整个统计工作中具有重要的作用。二、数据整理的程序数据整理方案的设计数据的审核与检查数据的排序数据分组数据的显示——统计图表数据的积累与保管第二节 数据分组一、数据分组的概念根据统计研究目的和客观现象的内在特点,按照选定的某个或几个标志,将被研究的总体数据分成若干部分的科学分类。二、数据分组的作用(1)区分现象的类型。(2)反映总体的内部结构。(3)揭示现象之间的依存关系。(4)反映事物的数量特征和发展规律。第二节 数据分组三、数据分组的关键**选择分组标志和分组划分各组界限(针对数值型变量)。四、选择分组标志的原则**1.根据研究任务和目的选择分组标志。2.选择能反映事物本质特征或重要特征的标志。3.结合现象所处的历史条件和社会经济条件选择分组标志。第二节 数据分组(一)根据分组变量(标志)的性质不同按品质变量分组按数值变量分组 (二)根据采用的分组标志的个数多少简单分组:只按一个标志分组复合分组:按两个或以上的标志分组五、统计分组的种类第 三 节分配数列和次数分布一、分配数列(一)概念(二)分配数列的要素组别次数(频数):分布在各组的总体单位数。各组的次数(频数)之和等于总体单位总数。频率(比重):各组次数占总次数的比重。各组比重之和等于100%(或1)。将总体按分组标志分组后形成的总体单位在各组的分布,又称次数分布数列或频数分布数列。分配数列实例表3-1 我国土地状况分组表(三)分配数列的种类1.按分组标志的性质不同品质变量数列:按品质变量分组形成数值变量数列:按数值变量分组形成2.数值变量数列又可分为:单项数列:每组只有一个变量值的变量数列组距数列:每组变量值是一段区间的变量数列连续变量数列:按连续变量分组形成的数列离散变量数列:按离散变量分组形成的数列品质变量分配数列实例表3-2 某高校在校生性别状况分组表数值变量分配数列实例表3-3 某市餐饮业按营业额分组单项式变量数列实例表3-4 某市居民家庭按家庭人口数分组组距式变量数列实例表3-5 某车间工人按月工资分组1.概念术语(1)全距(R)=数列中最大变量值-最小变量值(2)组限:每一组的最大变量值与最小变量值上限:每一组的最大变量值下限:每一组的最小变量值(3)组距(d):每一组的最大变量值与最小变量值之差组距=上限—下限(4)组数:数列中的分组个数。(四)分配数列的编制定性关系:全距一定的情况下,组数和组距呈反方向变动。定量关系:式二为确定组距的经验公式,其中N代表组数。组数和组距的关系组数=全距/组距=R/d组距=R/(1+3.322lgN)(四)分配数列的编制1.概念术语(5)频数(次数)与频率(比重)(6)品质数列与变量数列(7)等距数列与异距数列(8)次数密度:单位组距内分布的总体单位数。公式:次数密度=各组次数 / 各组组距开口组:缺上限或缺下限的组闭口组:上下限齐全的组(10)组中值及计算**①闭口组临近组组限重合时:组中值=(上限+下限)/ 2临近组组限间断时:组中值=(下限+下组下限)/2②开口组缺上限时: 组中值=下限+邻组组距/ 2缺下限时: 组中值=上限 -邻组组距/ 21.概念术语(9)(四)分配数列的编制2.注意事项(1)组距最好为5或10的倍数。(2)最小组的下限略低于最小变量值,最大组的上限略高于最大变量值。(3)离散型变量分组,相邻组的组限可以间断,也可以重叠;连续型变量分组,相邻组的组限必须重叠。(4)组限重叠时,临界点的总体单位按“上限不在内”的原则归组。(四)分配数列的编制3.简单次数分布数列的编制步骤数据排序并计算全距确定变量数列的形式(单项式或组距式)确定组数和组距确定组限计算各组次数和频率绘制表格简单次数分布数列的编制实例[例3-1]数据资料某车间40名工人日产零件如下:65 72 66 57 90 86 83 68 7584 66 59 67 70 79 51 81 5478 86 94 64 77 74 76 96 6298 85 71 79 84 65 72 89 75简单次数分布数列的编制实例编制步骤之一——数据排序并确定全距将数据从低到高排列,形成如下变量序列:51 54 57 59 62 64 65 65 66 6667 68 70 71 72 72 74 75 75 7676 77 78 78 79 81 83 84 84 8485 86 86 88 89 90 93 94 96 98计算全距=98-51=47编制步骤之二——确定变量数列的形式因变量值较多、变动幅度较大,适宜采用组距式数列。简单次数分布数列的编制实例编制步骤之三——确定组数和组距[分析] 全距为47,分为5组,组距为10。编制步骤之四——确定组限[分析] 离散型变量分组,相邻组的组限可以重叠,也可间断,本例选择重叠。编制步骤之五——计算各组的频数和频率[分析] 根据排序后的变量序列清点各数据区间的频数并计算比重,也可利用Excel统计软件进行。简单次数分布数列的编制实例编制步骤之六——绘制表格 表3-6 某车间工人日产零件分组表4.累计次数分布表(图)的编制(1)累计次数和累计频率 反映总体单位分布特征的指标,用以说明总体中在某一变量值水平上下总共包含的总体单位次数和频率。(2)累计次数和频率的计算方法 向上累计:是将各组的次数和频率,由变量值低的组向高的组累计。说明各组上限以下包含的总体单位数和比率。 向下累计:是将各组的次数和频率,由变量值高的组向低的组累计。说明各组下限以上包含的总体单位数和比率。累计次数分布数列的编制实例[例3-2] 根据例3-1编制的累计次数分布表如下:表3-7 某车间工人日产零件累计分组表二、次数分布社会经济现象的分布主要有以下三种类型:(一)钟形分布/丘形分布1.含义: 特点是“两头小,中间大”,即越靠近中间的变量值分布次数愈多;愈远离变量值中点分布的次数愈少,形态如钟或山丘。正态分布:左右两侧对称分布2.种类 左偏分布:存在极小变量值时曲线向左偏的偏态分布 非对称分布右偏分布:存在极大变量值时曲线向右偏的非对称分布正态分布 左偏分布 右偏分布二、次数分布(二)U形分布:是指较大和较小的变量值出现的次数多,而中间变量值出现的次数少,特点是“两头大,中间小” 。(三)J形分布:J形分布的特征是“一边大,一边小”。即次数随着变量值的变化大多数集中在某一端的分布。其曲线形如英文字母的“J”字,具体有正J形分布和反J形分布两种类型。U形分布 正J形分布 反J形分布**思考题:以下现象的次数分布符合哪种分布的特征?A 人群中身高、体重的分布 B 学生考试成绩的分布C 按人口年龄分布的死亡率 D 餐饮企业销售额的分布第四节 统计图表(一)统计表的概念(二)统计表的结构1.从形式上看:分为总标题、横行标题、纵栏标题和统计数值。2.从内容上看:分为主词和宾词。(三)统计表的种类简单表:主词未做任何分组。简单分组表:主词按一个标志分组。复合分组表:主词按两个或以上的标志分组。(四)统计表的编制规则一、统计表(一)概念条形图(二)种类 直方图和折线图圆形图二、统计图统计表示例某居民小区家庭按月收入简单分组表统计图示例条形图——用长短或高矮来显示数值的大小统计图示例折线图——将直方图的各条形中点用线连接起来而得到。统计图示例圆形图/饼图:是以圆形的分割来表示总体的分组及结构。(某居民小区家庭按月收入分组情况)本章小结一、统计数据整理统计数据整理是统计数据调查的继续和数据分析的前提,是感性认识上升到理性认识的连接点。数据整理的前提是审核,分组汇总是核心。按品质变量分组的关键是界定各类型组的性质差异,按数值变量分组的关键是正确确定各组的数量界限,即组数与组限。二、统计分组统计分组必须遵循穷尽性和互斥性两个原则。数值变量分组有单项式和组距式两种。组距式分组又有离散型与连续型、等距与异距分组之分,对于组距式分组要计算组距、组数、组中值。本章小结三、分配数列/次数分布数列由两个要素构成,一是组别,二是各组次数或频率。根据需要,可以编制简单次数分布表和累计次数分布表。四、次数分布主要有钟形分布、U形分布和J形分布。五、统计表和统计图统计表和统计图是显示统计数据的两种重要形式。统计表的结构从形式看可分为总标题、横表目、纵标目和指标数值;从内容上看可分为主词和宾词两部分。统计图主要有条形图、直方图、圆形图等。END 展开更多...... 收起↑ 资源预览