资源简介 (共44张PPT)第2章 数据收集与显示第一节 数据的计量第二节 数据的收集第三节 数据的显示学习目标认识数据的计量尺度和数据类型了解数据的搜集和数据的质量要求掌握统计分组原理和频数分布数列编制掌握茎叶图和箱线图的制作方法掌握统计表和统计图的使用第一节 数据的计量一、数据的计量尺度二、数据的类型数据的计量尺度定类尺度定序尺度定距尺度定比尺度数据的计量尺度定类尺度(Nominal scale)也称列名尺度或分类尺度计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类别”具有=或 的数学特性定序尺度(Ordinal scale)也称顺序尺度对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“类别”,但有序具有>或<的数学特性定距尺度(Interval scale)也称间隔尺度对事物的准确测度比定序尺度精确数据表现为“数值”没有绝对零点具有 + 或 - 的数学特性定比尺度(Ratio scale)也称比率尺度对事物的准确测度与定距尺度处于同一层次数据表现为“数值”有绝对零点具有 或 的数学特性四种计量尺度的比较四种计量尺度的比较定类尺度 定序尺度 定距尺度 定比尺度分类( = ,≠ ) 排序( < ,> ) 间距( + ,- ) 比值( × ,÷ ) √ √ √ √ √ √ √√√√计量尺度数学特性“√”表示该尺度所具有的特性数据的类型1.定类数据:由定类尺度计量形成2.定序数据:由定序尺度计量形成3.定距数据:由定距尺度计量形成4.定比数据:由定比尺度计量形成 与数据计量尺度相对应,数据也有四种:定类数据、定序数据、定距数据、定比数据不同计量层次、不同数据类型与不同统计分析方法比较测量尺度 数据类型 一般案例 适用的统计分析方法描述统计方法 推断统计方法定类尺度 类型数据 单位性质 比例、众数、 异众比率 列联表分析、卡方检验等定序尺度 顺序数据 质量等级 比例、中位数、 四分位差 计算等级相关系数等非参数分析定距尺度 数值型数据 温度 全距、均值、 标准差 积差相关系数、t检验、ANOVA回归、因子分析定比尺度 数值型数据 重量 几何均值、 调和平均数 变异系数第二节 数据的搜集一、数据的直接获取二、数据的间接获取数据的直接获取统计报表制度普查重点调查典型调查抽样调查统计报表制度(system of statistical report)按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供统计资料资料来源于基层单位的原始记录主要特点:制度化、规范性、层次性、周期性广泛应用于我国各级政府部门、企事业单位局限性:时滞性普查(census)为特定目的专门组织的非经常性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄总体重点调查(major survey)在调查对象中选择一部分重点单位进行调查,借以了解总体基本情况的一种非全面调查重点单位:在总体中具有举足轻重地位的单位,这些单位数虽少,但它们调查的标志值在总体标志值中占有绝大比重典型调查(typical survey )根据调查的目的和要求,在对研究对象进行全面分析的基础上,有意识地选择部分有代表性的单位进行调查,是一种非全面调查选典方式:(1)近似的估计总体的数值,可“划类选典”(2)了解总体的一般数量表现,可“择中选典”(3)研究成功的经验或失败的教训,可“优劣选典”抽样调查(sampling survey)1. 从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法总体 随机样本 2. 具有经济性、时 效性强、适应面广、准确性高等特点数据的间接获取Internethttp//WWW.中国统计年鉴2010中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料第三节 数据的显示一、数据的审核二、统计分组与频数分布三、统计表与统计图Excel数据的审核直接来源数据的审核:完整性、准确性间接来源数据的审核 :完整性、准确性、适用性和时效性统计分组按照统计研究的目的,将数据分别列入不同的组内形式:品质标志分组:按列名尺度和顺序尺度对总体的性质和属性进行分组数量标志分组:按间隔尺度和比例尺度对总体的数量特征进行分组单项式分组数列中每个组的变量值都只有一个,即一个变量值为一组适用于变异幅度不太大的离散型变量组距分组(要点)将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组 ~ ~ ~ ~ ~ 组距分组(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数确定组限:最小组的下限略低于或等于最小变量值,最大组上限略高于或等于最大变量值。若采取连续型分组数列,重叠组限的归组:“上限不在内原则”统计出各组的频数并整理成频数分布表组距分组(几个概念)1. 下限(low limit) :一个组的最小值2. 上限(upper limit) :一个组的最大值3. 组距(class width) :上限与下限之差4. 组中值(class midpoint) :下限与上限之间的中点值开口组组中值开口组的使用:当数据中存在少数极值时,为了不让数列组数太多,则考虑采用开口组开口组组中值假定:以相邻组的组距作为开口组组距频数分布的类型对称分布右偏分布左偏分布正J型分布反J型分布U型分布几种常见的频数分布统计表2008年全国分行业增加值 (表头:总标题)项 目 增加值纵栏标题(纵标目)数字资料产值 (亿元) 比重 (%)横行标题(横标目) 第一产业 34000.0 11.31第二产业 146183.4 48.62第三产业 120486.6 40.07合 计 300670.0 100资料来源:《中国统计年鉴2010》,北京:中国统计出版社 (表脚)定性数据的图示条形图饼图环形图累计频数分布图条形图(bar Chart)用宽度相同的条形的高度或长短来表示各类别数据各类别可放在纵轴,称为条形图,可以放在横轴,称为柱状图(column chart)条形图有单式、复式和叠加等形式世界上部分国家的互联网普及率条形图饼图(pie Chart)用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题企业法人单位的所有制结构饼图环形图(doughnut chart)环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究某届亚运会上中国、日本和韩国的奖牌构成环形图累计频数图(cumulative frequency chart)根据累计频数或累计频率绘制定性数据中只有定序数据分组才能作累计频数图有“向上累计”与“向下累计”之分学生成绩累计频数图定量数据的图示直方图折线图曲线图茎叶图箱线图累计频数图Excel直方图(histogram)用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1折线图(frequency polygon)折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的茎叶图(stem-and-leaf plot)用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留最后一位数字茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据茎叶图(例题分析)第一列给出每个茎上叶子的频数第二列是“茎”,第三列是“叶”上端标出了1个极端值30下端标出茎的宽度10、每个叶代表一个数据(案例)SPSS自动将每个茎重复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不重复50名学生统计学考试成绩茎叶图箱线图(box plot)用于显示未分组的原始数据的分布箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这5个值绘制而成的中位数是一组数据排序后处于中间位置上的变量值四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分位数画出箱子,再将两个极值点与箱子相连接箱线图(构成)中位数4681012Q75%Q25%XMaxXMinMedian/Quart./Range箱线图分布的形状与箱线图不同分布的箱线图对称分布左偏分布右偏分布累计频数图(cumulative frequency chart)50名学生统计学考试成绩累计频数分布图本章小结数据的计量尺度数据的类型统计数据的来源统计数据的质量统计数据的整理统计表与统计图 展开更多...... 收起↑ 资源预览