资源简介 (共43张PPT)《应用统计学》第三章统计数据整理应用统计学CONTENTS目录第一节 统计数据整理概述第二节 数据预处理第三节 统计分组第四节 统计图表应用统计学第一节 统计数据整理概述应用统计学一、 统计整理的意义:统计整理是根据研究的目的和任务,对调查阶段所收集到的大量原始资料进行科学的分类、汇总,为统计分析提供能描述现象总体数量的综合特征的工作过程。应用统计学二、统计整理的程序:审核和订正原始资料根据研究目的设计整理汇总方案编制各种统计图表应用统计学三、统计数据汇总的形式:手工汇总计算机汇总应用统计学第二节 数据预处理应用统计学数据预处理数据审核数据筛选数据排序检查数据中的错误计算检查和逻辑检查找出符合条件的数据升序和降序寻找数据的基本特征应用统计学第三节 统计分组应用统计学一、统计分组的意义和作用:1、统计分组的意义统计分组是根据统计研究的需要,将统计总体按照一定的标志区分为有联系的组成部分的一种统计分析方法。统计分组使组与组之间具有差别性,而同组内的单位保持相对的同质性。应用统计学2、统计分组的作用:从不同角度区分现象的类型,可以表明统计总体的基本性质和特征刻画现象总体的内部结构及其特征分析各类现象之间的依存关系应用统计学简单分组复合分组品质分组变量分组0102按分组标志的性质不同按分组标志的多少02质量指标类型分组结构分组分析分组03二、统计分组的种类:按分组标志的作用不同应用统计学实例:学生按性别、学历层次的简单分组男生学生女生研究生学生 本科生专科生应用统计学实例:学生按性别、学历层次的复合分组研究生男生 本科生专科生学生研究生女生 本科生专科生应用统计学三 、统计分组的方法1、按品质标志分组按品质标志分组,有些分组比较简单,分组标志一经确定,组的名称和组数也随之确定,如人口按性别只能分为男、女两组。有的品质分组比较复杂,组与组之间的界限难以确定,如人口按职业分组,这类标志分组的详细程度一般要根据分析任务的要求,经过事先研究并规定统一划分标准,编制统一分类目录作为分组的统一依据。应用统计学三 、统计分组的方法2、按数量标志分组按数量标志分组,应注意以下两个问题:一是分组时各组数量界限的确定必须能反映事物质的差别。二是应根据现象总体的数量特征,采用适当的分组形式,确定相宜的分组及组限。应用统计学变量数列的种类和编制单项式变量数列是每一个组只有一个变量值的变量数列(如表3-1)组距式变量数列是将变量的取值范围划分为若干个区间,以一个变动区间为一个组的变量数列。(如表3-2)应用统计学表3-1 某企业3月份工人日产量表日产量(件) 工人人数(人) 比重(%)3 10 8.74 15 13.05 30 26.16 40 34.87 20 17.4合计 115 100.0应用统计学表3-2 某班学生《统计学》考试成绩表成绩(分) 频数(人) 频率(%)60以下 2 6.760-70 4 13.370-80 9 30.080-90 11 36.790以上 4 13.3合计 30 100应用统计学数据分组的步骤:排序求全距(极差=最大值-最小值)组数斯特格斯(Sturges)经验公式:组数K=1+log10N/log102=1+3.322lgN频数分布表确定各组组限计算频数分组形式确定变量的形式(单项式分组、组距式分组)组距组距=极差/组数=(最大值-最小值) /组数应用统计学实例:某生产车间50名工人日加工零件数如下(单位:个)。对数据进行分组。117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121应用统计学单项式分组表3-3 某车间50名工人日加工零件数分组表 零件数 (个) 频数 (人) 零件数 (个) 频数 (人) 零件数 (个) 频数(人)107 108 110 112 113 114 115 117 118 1 2 1 2 1 1 1 3 3 119 120 121 122 123 124 125 126 127 1 2 1 4 4 3 2 2 3 128 129 130 131 133 134 135 137 139 211122112应用统计学组距式分组极差=最大值-最小值=139-107=32K=1+3.322lgN=1+3.322×lg50≈7组距=极差/组数=32 /7=4.6 ≈5应用统计学组距式分组表3-4 某车间50名工人日加工零件数分组表 按零件数分组 频数(人) 频率(%)105~110 110~115 115~120 120~125 125~130 130~135 135~140 3 5 8 14 10 6 4 610162820128合计 50 100应用统计学数据分组与频数分布的注意点03040102连续型变量:习惯上规定上组限不在内离散型变量:两组组限间断的办法“不重不漏”原则空白组与开口组等距与不等距分组组中值开口组通常以相邻组的组距为组距频数密度=频数/组距(单位组距内分布的频数)组中值=(上限+下限)/2缺上限的组中值=下限+邻组组距/2,缺下限的组中值=上限-邻组组距/2应用统计学表3-5 离散变量组距数列商店按职工人数分组(人) 商店数(个)1——5 6——10 11——15 16——20 21——25 9133195合计 67实例:应用统计学表3-6 某车间50名工人日加工零件数分组表(将最小值改为96,最大值改为160 按零件数分组 频数(人) 频率(%)95~100 100~105 105~110 110~115 115~120 120~125 125~130 130~135 135~140 140~145 145~150 150~155 155~160 160~165 1 0 2 5 8 14 10 6 3 0 0 0 0 1 2041016282012600002合计 50 100实例:应用统计学表3-7 某车间50名工人日加工零件数分组表 按零件数分组 频数(人) 频率(%)110以下 110~115 115~120 120~125 125~130 130~135 135以上 3 5 8 14 10 6 4 610162820128合计 50 100实例:应用统计学累计频率向上累计是将各组频数和频率,由变量值小的组向变量值大的组逐组累计。每组累计的频数、频率表明各组上限以下总共包含的总体次数和比率有多少。向下累计是将各组频数和频率,由变量值大的组向变量值小的组逐组累计。每组累计的频数、频率表明各组下限以上总共包含的总体次数和比率有多少。应用统计学表3-8 某班学生《统计学》考试成绩表成绩(分) 频数(人) 频率 (%) 向上累计频数(人) 向上累计频率(%) 向下累计频数(人) 向下累计频率(%)60以下 2 6.7 2 6.7 30 100.060-70 4 13.3 6 20.0 28 93.370-80 9 30.0 15 50.0 24 80.080-90 11 36.7 26 86.7 15 50.090以上 4 13.3 30 100.0 4 13.3合计 30 100 --- --- --- ---实例:应用统计学第四节 统计图表应用统计学一、统计表的概念狭义的统计表是将调查得来的说明总体数量特征的经过汇总整理后的数字资料,按照一定的指标顺序填列在一定的表格内,这个表格就是统计表。广义的统计表是以纵横线条交叉结合成的表格,用来表现统计资料的一种形式。应用统计学统计表由主词和宾词两部分构成。主词是统计表所研究总体及其各个组成部分。宾词是说明总体的统计指标。统计表包括总标题横行标题纵栏标题数字资料0102从统计表的形式看从统计表的内容看二、统计表的结构:应用统计学实例:应用统计学表3-11 2022年中国国内生产总值及构成按产业分组 国内生产总值 总数(亿元) 比重(%)第一产业 88345 7.30第二产业 483164 39.92第三产业 638698 52.78合计 1210207 100三、统计表设计应用统计学1、统计表表式设计注意事项:(1)设计为长方形表格(2)线条的绘制(3)合计栏的设置(4)栏数的编号三、统计表设计应用统计学2、统计表内容设计注意事项(1)标题设计(2)指标数值(3)计量单位(4)注明资料来源01折线图0203曲线图0405饼图条形图直方图用宽度相同的条形的高度和长度表示次数分布用圆形及圆内扇形的面积来表示次数分布横坐标,按照顺序表示不同的区间(组),用矩形条,表示相应区间数据的频次或频率。把直方图顶部的中点用直线连接起来,再把原来的直方图抹掉,折线图的两个终点要与横轴相交当变量数列的组数无限增加时,折线近似表现为一条平滑曲线四、统计图的类型应用统计学实例:从某城市抽出30个商店,某商品的价格数据9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 10.06 10.0110.03 9.99 9.97 9.93 10.01 10.03 10.03 10.02 10.05 9.999.95 9.96 9.98 10.00 9.97 10.01 10.00 9.99 9.98 10.00可以选用那种统计图来描述数据的特征?应用统计学应用统计学实例:某生产车间50名工人日加工零件数如下(单位:个)。用统计图描述数据特征。117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121应用统计学135频数(人)1512963105110115120125130140日加工零件数(个)302418126%135140日加工零件数(个)1512963频数(人)105110115120125130应用统计学曲线图的类型(钟型、U型、J型)对称曲线右偏曲线左偏曲线U型曲线正J型曲线反J型曲线应用统计学谢 谢应用统计学 展开更多...... 收起↑ 资源预览