3统计数据的整理 课件(共63张PPT)-《应用统计学(第4版)》同步教学(人民邮电版)

资源下载
  1. 二一教育资源

3统计数据的整理 课件(共63张PPT)-《应用统计学(第4版)》同步教学(人民邮电版)

资源简介

(共68张PPT)
应用统计学
Applied Statistics
第01章 绪论
第02章 统计数据的收集
第03章 统计数据的整理
第04章 描述性统计
第05章 抽样
第06章 参数估计
第07章 假设检验
第08章 方差分析
第09章 时间序列分析
第10章 统计指数
第11章 相关回归分析
授课内容
第三章 统计数据的整理
第三章 统计数据的整理
第三章 统计数据的整理
第三章 统计数据的整理
Practical Statistics
理论部分
第三章 统计数据的整理
Practical Statistics
数据透视表
数据排序
数据筛选
数据审核
数据透视表
数据排序
数据筛选
数据审核
原始数据
二手数据
数据透视表
数据排序
数据审核
数据筛选
数据筛选
数据透视表
数据排序
数据审核
数据筛选
数据排序
数据透视表
数据审核
数据筛选
数据排序
数据透视表
数据审核
数据筛选
数据排序
可以从复杂的数据中提取有用的信息
可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图
形成一个符合需要的交叉表(列联表)
在利用数据透视表时,数据源表中的首行必须有列标题
数据审核
数据筛选
数据排序
数据透视表
数据审核
数据筛选
数据排序
数据透视表
Practical Statistics
数据整理
第三章 统计数据的整理
Practical Statistics
第三章 统计数据的整理
Practical Statistics
统计表的分类
统计表的分类
年份 财政收入(亿元) 财政支出(亿元)
2002 18903.64 22053.15
2003 21715.25 24649.95
2004 26396.47 28486.89
2005 31649.29 33930.28
2006 38760.2 40422.73
2007 51321.78 49781.35
2008 61330.35 62592.66
表3-1 我国历年财政收入与财政支出表
(资料来源:《中国统计年鉴2009》)
简单表
统计表的分类
分组表
专业 2009年 2010年 就业人数 灵活就业人数 毕业生人数 就业率(%) 就业人数 灵活就业人数 毕业生人数 就业率(%)
会计学
行政管理
市场营销学
国际贸易
金融学
合计
表3-2某高校商学院2009~2010年毕业生就业情况统计表
统计表的分类
复合表
企业名称 工业增加值 企业规模 全年利润
国有
大型
中型
小型
私营
大型
中型
小型
表3-3 2010年对某地区100家工业企业调查表
统计表的设计规则
统计表的结构
统计表的设计要求
表头应该简洁凝练
合理安排统计表的结构
纵横格线绘制规则
填充数据规则
注释的规则
第三章 统计数据的整理
Practical Statistics
第三章 统计数据的整理
Practical Statistics
品质数据的整理与展示
频数(frequency)是落在某一特定类别或组中的数据个数。把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布。
品质数据的整理与展示
累积频数(cumulative frequencies):各类别频数的逐级累加。
累积频率(cumulative percentages):各类别频率(百分比)的逐级累加。
品质数据的整理与展示
向上累计,又称以下累计,是将各组次数和比率,由变量值低的组向变量值高的组逐组累计。组距数列的向上累计,表明各组上限以下(小于上限)总共所包含的总体次数。
向下累计,又称以上累计,是将各组次数和比率,由变量值高的组向变量值低的组逐组累计。(大于等于下限)
品质数据整理与展示
【例1】一家市场调查公司为研究不同品牌手机的市场占有率,采用网络辅助调查的方式对随机某知名手机论坛的100名会员进行调查,调查结果见右表。
品质数据整理与展示
【例2】某居民小区物业公司欲了解业主对物业服务的评价,制订了一份调查问卷,其中一项是业主对物业服务的总体评价,包括五个选项:1.非常满意、2.满意、3.基本满意、4.不满意、5.非常不满意
数值型数据的整理与展示
数值型数据的整理与展示
数值型数据的整理与展示
将一个变量值作为一组
适合于变量值较少的离散型数据
数值型数据的整理与展示
将变量值的一个区间作为一组
适合于变量值较多的连续型变量
分为等距分组和异距分组
数值型数据的整理与展示
上限(upper limit) :一个组的最大值
下限(low limit) :一个组的最小值
组距(class width) :上限与下限之差
组中值(class midpoint) :下限与上限之间的中点值
数值型数据的整理与展示
确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5 K 15,可以按 Sturges 提出的经验公式确定组数K:
数值型数据的整理与展示
确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:
组距=( 最大值 - 最小值)÷ 组数
第三章 统计数据的整理
Practical Statistics
第三章 统计数据的整理
Practical Statistics
数值型数据的整理与展示
【例】请利用2009年某班级50名同学的《统计学》课程期末考试成绩绘制直方图和折线图,包括不可变直方图和可变直方图两种形式。
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
用于显示未分组的原始数据的分布
由“茎”和“叶”两部分构成,其图形是由数字组成的
以该组数据的高位数值作树茎,低位数字作树叶
树叶上只保留最后一位数字
茎叶图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成
绘制方法:
首先找出一组数据的5个特征值,即最大值、最小值、中位数和两个四分位数
连接两个四分位数画出箱子,再将两个极值点与箱子相连
数值型数据的整理与展示
最小值
最大值
中位数
下四分位数
上四分位数
某地324名建筑行业农民工不同年龄段身高分布单式箱线图
某地324名建筑行业农民工不同婚姻状况分年龄段体重分布复式箱线图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
时间序列数据(Time series data):线图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
双变量数据:散点图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
变量数据:散点图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
多变量数据:气泡图
数值型数据的整理与展示
数值型数据的图示:
原始数据:茎叶图与箱线图
分组数据:直方图
时间序列数据:线图
多变量数据:散点图、气泡图、雷达图
多变量数据:雷达图
以意大利经济学家V.Pareto的名字而命名。也称排名图或主次因素图,用条形的长短表示各组的绝对数的多少,用线段的逐渐上升趋势表现各组构成接近100%的过程。它是条形图和构成图的结合。直条从高到低依次排列。
帕累托图
2000年全国人口年龄段构成的简单帕累托图
常用来作为质量控制工具,对个体或均数的变动情况进行监测。它是根据数理统计原理来确定一个范围,用以界定观察值或均数的波动是正常或异常的,并以图的形式表达。
质量控制图
5位评委的均数质控图
雷达图(radar chart)亦称综合财务比率分析图法,又可称为戴布拉图、螂蛛网图、蜘蛛图。是日本企业界的综合实力进行评估而采用的一种财务状况综合评价方法。按这种方法所绘制的财务比率综合图状似雷达,故得此名。
雷达图
“雷达图”分析法是从企业的生产性、安全性、收益性、成长性和流动性等五个方面,对企业财务状态和经营现状进行直观、形象的综合分析与评价的图形。因其形状如雷达(图)的放射波,而且具有指引经营“航向”的作用,故而得名。
先画出三个同心圆,并将其等分成五个扇形区,分别表示生产性、安全性、收益性、流动性和成长性。通常,最小圆圈代表同行业平均水平的1/2或最低水平;中间圆圈代表同行业平均水平;又称标准线;最大圆圈代表同行业先进水平或平均水平的1.5倍。在五个扇形区中,从圆心开始,分别以放射线形式画出5~6条主要经营指标线,并标明指标名次及标度。然后,将企业同期的相应指标值标在图上,以线段依次连结相邻点,形成折线闭环;构成雷达图。
雷达图
就各经营指标来看,当指标值处于标准线以内时,说明该指标低于同行业平均水平,需要加以改进;若接近最小圆圈或处于其内,说明该指标处于极差状态,是企业经营的危险标志,应重点加以分析改进;若处于标准线外侧,说明该指标处于理想状态,是企业的优势,应采取措施,加以巩固和发扬。
雷达图
合理使用图表
鉴别图表优劣的准则:
精心设计、有助于洞察问题的实质
使复杂的观点得到简明、确切、高效的阐述
能在最短的时间内以最少的笔墨给读者提供最大量的信息
如实反映数据
例题
在组距数列中,向下累计到某组的次数是100,这表示总体单位中
A. 大于等于该组下限的累计次数是100
B. 小于等于该组下限的累计次数是100
C. 大于该组上限的累计次数是100
D. 小于该组上限的累计次数是100
例题
对100名职工的工资收入情况进行调查,则总体单位是
100名职工
B. 100名职工的工资总额
C. 每一名职工
D. 每一名职工的工资
例题
调查几个重要的汽车生产基地,就可以了解我国汽车生产的基本情况和问题,这种调查属于
普查
抽样调查
典型调查
重点调查
例题
下列各项中属于全面调查的是
A. 重点调查 B. 典型调查
C. 抽样调查 D. 人口普查
统计数据按照计量层次分可分为分类数据、品质数据和数值型型数据。 ( )
熟悉Excel的基本操作
描述统计的Excel应用
图形的绘制
数据库管理
上机内容

展开更多......

收起↑

资源预览