资源简介 (共37张PPT)第 3 章 数据的可视化3.1 类别数据的可视化3.2 数值数据的可视化3.3 合理使用图表visualization思考一下如果让你看一个电商一个月每天的销售额数据,或者给你看这些数据的某个图形,你会选择哪种?将上市公司按行业分成金融业、地产业,旅游业、其他行业4个部分,要观察不同行业上市公司的个数,你认为应该用什么样的图?如果要观察不同行业上市公司的构成,你认为应该用什么样的图?要反映应一个地区的家庭收入分布状况,你会使用什么图形?要反映身高和体重的关系,你认为该使用什么图形?要比较两个上市公司的销售收入、净利润、净资产、负债4个指标的差异和相似性,你会使用什么样的图形?3.1 类别数据的可视化3.1.1 条形图3.1.2 饼图和环形图第 3 章 数据的可视化3.1.1 条形图3.1 类别数据的可视化条形图(bar Chart)用宽度相同的条形来表示各类别频数的图形,用于观察不同类别频数的多少或分布状况绘制时,各类别可以放在横轴,也可以放在纵轴,将各类别放在横轴绘制的条形图也称为柱形图(column chart)根据绘制变量的多少,条形图有简单条形图和复式条形图等不同形式简单条形图是根据一个类别变量绘制的,描述该变量的各类别的频数分布状况复式条形图是根据两个类别变量的各类别绘制的条形图。由于绘制方式的不同,复式条形图有堆积条形图、堆砌条形图、百分比条形图等不同形式条形图(例题分析)【例3—1】为研究不同地区的消费者对网上购物的满意度,随机抽取东部、中部和西部的500个消费者进行调查,得到的结果如表3—1所示。绘制条形图分析各类别的人数分布状况满意度东部中部西部总计非常满意27303996比较满意35332694一般374037114不满意273539101非常不满意29273995总计155165180500简单条形图(例题分析)简单条形图(例题分析)复式条形图(例题分析)复式条形图(例题分析)百分比条形图(例题分析)3.1.2 饼图和环形图3.1 类别数据的可视化饼图(dpiechart)用圆形及圆内扇形的角度来表示一个样本(或总体)中各类别的频数占总频数比例大小的图形,对于研究结构性问题十分有用环形图(doughnut chart)环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究3.2 数值数据的可视化3.2.1 直方图3.2.2 散点图和气泡图3.2.3 雷达图和轮廓图第 3 章 数据的可视化3.2.1 直方图3.2 数值数据的可视化直方图(histogram)用于展示数值型数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1不同分布形状的直方图直方图(例题分析)【例3—2】沿用第2章的例2—2。绘制直方图分析营业额的分布特征分组人数频率(%)200—25074.67250—300117.33300—3502214.67350—4003825.33400—4502919.33450—5002013.33500—550128.00550—60064.00600—65032.00650—70021.33合计150100.00直方图(例题分析)直方图(直方图与条形图的区别)条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列条形图主要用于展示类别数据,而直方图则主要用于展示定量数据3.2.2 散点图和气泡图3.2 数值数据的可视化散点图和气泡图(scatterplots& bubble chart)展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的图气泡图(bubble chart)可以看作是散点图的一个变种。在气泡图中,第3个变量数值的大小用圆的大小表示散点图(例题分析)【例3-3】我国31个地区2014年的地区生产总值(按收入法计算)、社会消费品零售总额和固定资产投资数据。绘散点图并观察它们之间的关系地区地区生产总值(亿元)社会消费品零售总额(亿元)固定资产投资(亿元)北京市21330.8396386924.23天津市15726.934738.710518.19河北省29421.1511820.526671.92山西省12761.495717.912354.53内蒙古17770.195657.617591.83辽宁省28626.581185724730.8散点图(例题分析)散点图(例题分析)气泡图(例题分析)3.2.3 雷达图和轮廓图3.2 数值数据的可视化雷达图和轮廓图(radarchart& outline chart)也称蜘蛛图(spider chart)从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图可用于研究多个样本在多个变量上的相似性轮廓图也称为平行坐标图或多线图,它是用横坐标表示各样本,纵轴表示每个样本的多个变量的取值,将不同样本的同一个变量的取值用折线连接,即为轮廓图雷达图(例题分析)【例3-4】2011年我国东部、中部、西部及东北地区城镇居民人均消费支出数据。绘制雷达图,比较不同地区的消费支出构成支出项目东部地区中部地区西部地区东北地区食 品6329.164710.735121.504730.34衣 着1754.981535.811618.171778.85居 住1635.171235.301162.231339.45家庭设备及用品1205.20870.73916.00841.70交通通信2838.341534.341699.591642.75文教娱乐2360.191475.511447.331443.02医疗保健1033.13855.99880.451144.63其他713.88428.56490.65570.51雷达图(例题分析)雷达图(例题分析)轮廓图(例题分析)轮廓图(例题分析)3.3 合理使用图表第 3 章 数据的可视化避免一切不必要的修饰。过于花哨的修饰往往会使人注重图表本身,而掩盖了图表所要表达的信息图形的比例应合理。一般而言,一张图形大体上约为4:3的一个矩形,过长或过高的图形都有可能歪曲数据,给人留下错误的印象图表应有编号和标题。编号一般使用阿拉伯数字,如表1、表2等等。图表的标题应明示出表中数据所属的时间(when)、地点(where)和内容(what),即通常所说的3W准则。表的标题通常放在表的上方;图的标题可放在图的上方,也可放在图的下方使用图表的注意事项结 束THANKS 展开更多...... 收起↑ 资源预览