资源简介 (共68张PPT)应用统计学Applied Statistics第01章 绪论第02章 统计数据的收集第03章 统计数据的整理第04章 描述性统计第05章 抽样第06章 参数估计第07章 假设检验第08章 方差分析第09章 时间序列分析第10章 统计指数第11章 相关回归分析授课内容第三章 统计数据的整理第三章 统计数据的整理第三章 统计数据的整理第三章 统计数据的整理Practical Statistics理论部分第三章 统计数据的整理Practical Statistics数据透视表数据排序数据筛选数据审核数据透视表数据排序数据筛选数据审核原始数据二手数据数据透视表数据排序数据审核数据筛选数据筛选数据透视表数据排序数据审核数据筛选数据排序数据透视表数据审核数据筛选数据排序数据透视表数据审核数据筛选数据排序 可以从复杂的数据中提取有用的信息 可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图 形成一个符合需要的交叉表(列联表) 在利用数据透视表时,数据源表中的首行必须有列标题数据审核数据筛选数据排序数据透视表数据审核数据筛选数据排序数据透视表Practical Statistics数据整理第三章 统计数据的整理Practical Statistics第三章 统计数据的整理Practical Statistics统计表的分类统计表的分类年份 财政收入(亿元) 财政支出(亿元)2002 18903.64 22053.152003 21715.25 24649.952004 26396.47 28486.892005 31649.29 33930.282006 38760.2 40422.732007 51321.78 49781.352008 61330.35 62592.66表3-1 我国历年财政收入与财政支出表(资料来源:《中国统计年鉴2009》)简单表统计表的分类分组表专业 2009年 2010年 就业人数 灵活就业人数 毕业生人数 就业率(%) 就业人数 灵活就业人数 毕业生人数 就业率(%)会计学行政管理市场营销学国际贸易金融学合计表3-2某高校商学院2009~2010年毕业生就业情况统计表统计表的分类复合表企业名称 工业增加值 企业规模 全年利润国有大型中型小型私营大型中型小型表3-3 2010年对某地区100家工业企业调查表统计表的设计规则 统计表的结构 统计表的设计要求表头应该简洁凝练合理安排统计表的结构纵横格线绘制规则填充数据规则注释的规则第三章 统计数据的整理Practical Statistics第三章 统计数据的整理Practical Statistics品质数据的整理与展示 频数(frequency)是落在某一特定类别或组中的数据个数。把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布。品质数据的整理与展示 累积频数(cumulative frequencies):各类别频数的逐级累加。 累积频率(cumulative percentages):各类别频率(百分比)的逐级累加。品质数据的整理与展示 向上累计,又称以下累计,是将各组次数和比率,由变量值低的组向变量值高的组逐组累计。组距数列的向上累计,表明各组上限以下(小于上限)总共所包含的总体次数。 向下累计,又称以上累计,是将各组次数和比率,由变量值高的组向变量值低的组逐组累计。(大于等于下限)品质数据整理与展示 【例1】一家市场调查公司为研究不同品牌手机的市场占有率,采用网络辅助调查的方式对随机某知名手机论坛的100名会员进行调查,调查结果见右表。品质数据整理与展示 【例2】某居民小区物业公司欲了解业主对物业服务的评价,制订了一份调查问卷,其中一项是业主对物业服务的总体评价,包括五个选项:1.非常满意、2.满意、3.基本满意、4.不满意、5.非常不满意数值型数据的整理与展示数值型数据的整理与展示数值型数据的整理与展示 将一个变量值作为一组 适合于变量值较少的离散型数据数值型数据的整理与展示 将变量值的一个区间作为一组 适合于变量值较多的连续型变量 分为等距分组和异距分组数值型数据的整理与展示 上限(upper limit) :一个组的最大值 下限(low limit) :一个组的最小值 组距(class width) :上限与下限之差 组中值(class midpoint) :下限与上限之间的中点值数值型数据的整理与展示 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5 K 15,可以按 Sturges 提出的经验公式确定组数K:数值型数据的整理与展示 确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:组距=( 最大值 - 最小值)÷ 组数第三章 统计数据的整理Practical Statistics第三章 统计数据的整理Practical Statistics数值型数据的整理与展示 【例】请利用2009年某班级50名同学的《统计学》课程期末考试成绩绘制直方图和折线图,包括不可变直方图和可变直方图两种形式。数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留最后一位数字茎叶图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成绘制方法:首先找出一组数据的5个特征值,即最大值、最小值、中位数和两个四分位数连接两个四分位数画出箱子,再将两个极值点与箱子相连数值型数据的整理与展示最小值最大值中位数下四分位数上四分位数某地324名建筑行业农民工不同年龄段身高分布单式箱线图某地324名建筑行业农民工不同婚姻状况分年龄段体重分布复式箱线图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图时间序列数据(Time series data):线图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图双变量数据:散点图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图变量数据:散点图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图多变量数据:气泡图数值型数据的整理与展示数值型数据的图示: 原始数据:茎叶图与箱线图 分组数据:直方图 时间序列数据:线图 多变量数据:散点图、气泡图、雷达图多变量数据:雷达图 以意大利经济学家V.Pareto的名字而命名。也称排名图或主次因素图,用条形的长短表示各组的绝对数的多少,用线段的逐渐上升趋势表现各组构成接近100%的过程。它是条形图和构成图的结合。直条从高到低依次排列。帕累托图2000年全国人口年龄段构成的简单帕累托图 常用来作为质量控制工具,对个体或均数的变动情况进行监测。它是根据数理统计原理来确定一个范围,用以界定观察值或均数的波动是正常或异常的,并以图的形式表达。质量控制图5位评委的均数质控图 雷达图(radar chart)亦称综合财务比率分析图法,又可称为戴布拉图、螂蛛网图、蜘蛛图。是日本企业界的综合实力进行评估而采用的一种财务状况综合评价方法。按这种方法所绘制的财务比率综合图状似雷达,故得此名。雷达图 “雷达图”分析法是从企业的生产性、安全性、收益性、成长性和流动性等五个方面,对企业财务状态和经营现状进行直观、形象的综合分析与评价的图形。因其形状如雷达(图)的放射波,而且具有指引经营“航向”的作用,故而得名。先画出三个同心圆,并将其等分成五个扇形区,分别表示生产性、安全性、收益性、流动性和成长性。通常,最小圆圈代表同行业平均水平的1/2或最低水平;中间圆圈代表同行业平均水平;又称标准线;最大圆圈代表同行业先进水平或平均水平的1.5倍。在五个扇形区中,从圆心开始,分别以放射线形式画出5~6条主要经营指标线,并标明指标名次及标度。然后,将企业同期的相应指标值标在图上,以线段依次连结相邻点,形成折线闭环;构成雷达图。雷达图 就各经营指标来看,当指标值处于标准线以内时,说明该指标低于同行业平均水平,需要加以改进;若接近最小圆圈或处于其内,说明该指标处于极差状态,是企业经营的危险标志,应重点加以分析改进;若处于标准线外侧,说明该指标处于理想状态,是企业的优势,应采取措施,加以巩固和发扬。雷达图合理使用图表鉴别图表优劣的准则: 精心设计、有助于洞察问题的实质 使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 如实反映数据例题 在组距数列中,向下累计到某组的次数是100,这表示总体单位中A. 大于等于该组下限的累计次数是100B. 小于等于该组下限的累计次数是100C. 大于该组上限的累计次数是100D. 小于该组上限的累计次数是100例题 对100名职工的工资收入情况进行调查,则总体单位是100名职工B. 100名职工的工资总额C. 每一名职工D. 每一名职工的工资例题 调查几个重要的汽车生产基地,就可以了解我国汽车生产的基本情况和问题,这种调查属于普查抽样调查典型调查重点调查例题 下列各项中属于全面调查的是A. 重点调查 B. 典型调查C. 抽样调查 D. 人口普查 统计数据按照计量层次分可分为分类数据、品质数据和数值型型数据。 ( ) 熟悉Excel的基本操作 描述统计的Excel应用 图形的绘制 数据库管理上机内容 展开更多...... 收起↑ 资源预览