资源简介 (共17张PPT)第4章 数据处理与应用浙教版信息技术(高中)必修1 数据与计算4.1 常用表格数据的处理课堂导入(1)数据整理的目的是 检测和修正错漏的数据 、 整合数据资源 、 规整数据格式 、 提高数据质量 。(2)常见的数据问题有 数据缺失 、 数据重复 、 数据异常 、 逻辑错误 、 格式不一致 等。数据问题 处理方法数据缺失 ①忽略含有缺失值的实例或属性②采用平均值、中间值或概率统计值来填充缺失值数据重复 可以通过 COUNTIF、“条件格式” 和排序功能查找,在审核后进行合并或删除等处理数据异常 指数据集中不符合一般规律的数据对象,它可能是要去掉的噪声,也可能是含有重要信息的数据对象逻辑错误 数据集中的属性值与实际值不符,或违背业务规则或逻辑。可通过 “数据验证” 功能检查格式不一致 可通过数据转换形成一个合适的形式。数据转换通常包括属性数据类型的转换、根据已有属性集构造新属性的转换、将不同来源的相同属性的定义及其值进行统一标准化表达的转换等【问题与讨论1】尝试读取文件 “问题与讨论1_问题.xlsx”,并回答以下问题,请将回答写在记事本中,保存好并上传。1、页A的“发布时间”列数据,有什么问题?2、页A的“功耗”列数据,有什么问题?3、在修改完以上问题之后,如果要把页A和页B的表格合并以方便对比,会遇到哪些问题?该如何处理?数据计算是数据处理的常用方法之一。日常简单的数据处理可以使用Excel完成,专业的数据处理和统计分析工具有SPSS、SAS、MATLAB等,也可通过Python、JAVA等计算机语言编程进行数据处理。4.1.2 数据计算常用的数据处理和统计分析工具Excel软件是微软公司推出的Microsoft Office系列套装软件中的组成部分,是一个简单易用的电子表格软件,可以进行数据的处理、统计分析和辅助决策操作,广泛应用于文秘办公、财务管理、市场营销、行政管理和协同办公等事务。SPSS是IBM公司推出的一款统计分析软件,具备数据收集、准备、分析、描述、解释和展现的功能。SPSS提供丰富的统计算法,并且操作简使、功能强大、扩展性强,但需要使用人员具备一定的数理统计学知识背器,比较退合专业分析、研究等人员使用。SAS是SAS软件研究所开发的一套大同集成应用软件系统,共有三十多个功能模块,具有数据访问、数据管理、数据分析、数据皇现等功能。SAS系统从大型机上的系统发展而来,其操作以编程为主。系统地学习和掌握SAS, 需要花费一定的精力,比较适合统计专业人员使用。MATLAB是MathWorks公司推出的一种科学计算语言和编程环境,主要应用于数据分析、无线通信、深度学习、计算机视觉、量化金融与风险管理等领域。MATLAB 将适合选代分析和设计过程的桌面环境与直接表达矩阵和数组远算的编程语言相结合,为分析数据、开发算法和创建模型等提供了便于探索和发现的环境,深受工程师和料学家的青缺。拓展链接算术运算符 :+、-、*、/、^、%比较运算符:=、>、<、>=、<=、<>结果的逻辑值:TRUE/FALSE文本连接运算符:&SUM (numberl, [number2],...) 求参数的和AVERAGE (numberl, [number2],...) 求参数的平均值MIN (numberl, [number2],...) 返回参数列表中的最小值MAX (numberl, [number2]._.) 返回参数列表中的最大值函数是预定义的公式,参数可以是数字、单元格或单元格区域。运算符和函数A2 相对引用$A$2 绝对引用:行列都锁定$A2 绝对引用:仅列锁定A$2 绝对引用:仅行锁定【问题与讨论1.5】尝试读取文件 “问题与讨论1.5_问题.xlsx”,并回答以下问题。1、在 Excel 中,单元格 C1 输入 5,C2 输入 8,C3 输入 12,使用 SUM(C1:C3) 计算结果是多少?2、计算C4、D4、E4、F4相加后的的平均值3、使用 MIN(C4:F4) 计算这组数据中的最小值是多少?4、使用 MAX(C4:F4) 求这几个数中的最大值是多少?【问题与讨论2】尝试读取文件 “问题与讨论2_问题.xlsx”,并回答以下问题。1、在公式填充过程中,公式中的相对引用和绝对引用有何区别?2、在P3和P10分别输入 =H3/$C3 =H10/C10,然后向右填充,结果有什么不同?为什么?3、请算出各赛季场均的各项数据(场均 = 总计 / 出场)4、将各赛季场均数据填充完整最快需要几步操作?如何表述每一步?5、如果要引用骑士队16-17赛季的总计表现,请写出引用的单元格区域,这是连续引用还是不连续引用?如果要引用03-10赛季的三分球总数呢?Excel中的错误类型和常用工具错误类型 错误名称 错误原因#DIV/0! 除零错误 除数为0#REF! 引用错误 删除(不是清除)了一个在公式中被引用的单元格#VALUE! 数据类型错误 如一个文本型加一个数值型#NAME! 函数名错误如 sum 拼成了 sun######## 不是错误,是列宽不够造成的 图示 功能合并选中的几个单元格,并且设置对齐方式为水平居中增加小数位数;减少小数位数当单元格中的内容超出列宽时,在本单元格中自动换行在单元格中水平方向的对齐方式在单元格中垂直方向的对齐方式Excel中的错误类型和常用工具图表是用视觉形式向人们展示数据的一种方法。常见的图表类型有柱形图、折线图、饼图、雷达图、散点图、气泡图等。在运用图表表现数据时,通常依据数据间的关系选择相应的图表类型。4.1.3 数据图表呈现图表类型 特点 常见用法案例柱状图 可以非常清晰地表达不同项目之间的差距和数值。 通常用于不同时期或不同类别数据之间的比较。折线图 用来表现数据随时间推移而发生变化,可以预测未来的发展趋势。 判断每组数据的峰值与谷值,以及折线变化的方向、速率和周期等特征。散点图 用来说明若干组变量之间的相互关系,可表示因变量随自变量而变化的大致趋势。 可用数据点来说明数据的变化趋势、离散程度以及不同系列数据间的相关性。饼图 分析内部各个组成部分对事件的影响,其各部分百分比之和必须是100%。 通常用来描述构成比例方面的信息,可方便比较一个总体的每个部分所占比例。雷达图 可以对两组变量进行多种项目的对比,反映数据相对中心点和其他数据的变化情况。 常用于多项指标的全面分析,使图表阅读者能够对各项指标变动情况和好坏趋向一目了然。尝试读取文件 “问题与讨论3.docx”和“问题与讨论3.xlsx”,并回答以下问题。1、柱形图、折线图、饼图、雷达图、散点图、气泡图等分别适合展现何种数据关系?【问题与讨论3】★常见的图表类型有柱形图、折线图、饼图、雷达图、散点图、气泡图等。其中柱形图用于对比数据大小;折线图用于描述数据变化的趋势;饼图用于描述数据构成百分比;雷达图用于多项指标比较;散点图、气泡图用于反映变量之间的关联或分布趋势。问题与讨论3【答案】【问题与讨论4】尝试读取文件 “问题与讨论4.xlsx”,并回答以下问题。1、请创建合适的图表。2、并说说通过观察该表,你发现了什么?分析数据数据以电子表格的形式进行组织和存储,其中,2012~2016年北京市、天津市、上海市三地国内生产总值的数据包含时间趋势和大小比较的两层关系,因此图表类型可以选用折线图。·创建图表①选择要在图表中展示的数据区域A2: F4, A10: F10。②单击“插人”选项卡上的“插入折线图或面积图”按钮,选择“折线图”, 生成的折线图如图4. 1. 5所示。③使用图表右上角附近的“图表元素”按钮,可添加坐标轴标题和数据标签等图表元素,使用“图表样式”按钮可自定义图表的外观,使用“图表筛选器”按钮可更改图表中显示的数据。另外,选中图表,使用“设计”和“格式”选项卡可自定义图表的外观,美化图表。图4.1.5 2012-2016年北京、天津、上海生产总值折线图检查图表查看图表中数据的展现是否完整,将鼠标移到折线相应的数据点上,查看数据卡显示的数据与表格中的数据是否一致。观察折线的走势,发现北京市、天津市、上海市三地国内生产总值在2012~2016年间一直呈________趋势。 展开更多...... 收起↑ 资源预览