资源简介 (共66张PPT)中等职业学校公共基础课程教材信息技术(基础模块)(下册)数据处理——让数据提供有价值的信息模块4目录采集数据项目4.1 加工数据项目4.2 分析数据项目4.3 初识大数据项目4.4 相关知识相关知识1.常用图文编辑软件和工具2.文档的基本操作3.文档的信息操作项目4.1 操作图文编辑软件1.数据与数据处理数据是指对客观事件进行记录并可以鉴别的,能对客观事物的性质、状态以及相互关系等进行记载的物理符号或符号组合。数据可以分为结构化数据、非结构化数据、半结构化数据。2.常用的数据处理软件数据处理的不同环节,可能会涉及不同软件的使用,例如采集环节可以使用专业的采集软件,加工环节和分析环节可以使用Excel、WPS表格等软件,下图为常用的数据处理软件及其特点。3.数据的输入、导入和引用在Excel中可以输入各种类型的数据,如文本、数字、身份证、小数、货币等,也可以快速填充有规律的数据,如学号这类等差序列。当需要输入普通数据时,只需在工作表中选择单元格,然后输入数据并按【Enter】键;当需要输入有规律的数据,如等差序列时,可首先在单元格中输入起始数据,如输入“1”然后按住【Ctrl】键的同时拖曳该单元格右下角的填充柄,填充等差序列。(1)数据输入3.数据的输入、导入和引用在“数据”/“获取外部数据”组中单击“自文本”按钮,打开“导入文本文件”对话框,选择文本文件对象,单击“导入”按钮。(2)数据导入3.数据的输入、导入和引用数据引用是指引用工作簿、网络或计算机中的其他数据, 其方法为: 在“ 数据”/“获取外部数据”组中单击“现有连接”按钮,打开“现有连接”对话框,选择需要连接的文件,单击“导入”按钮,然后根据提示设置引用范围和导入位置,引用指定文件中的数据。(3)数据引用4.设置数据类型和美化数据选择数据所在的单元格或单元格区域,在“开始”/“数字”组的“数据类型”下拉列表框中选择需要的类型选项。如果该组中现有的参数和按钮无法满足需要,可单击“展开”按钮,在打开的“设置单元格格式”对话框的“数字”选项卡中进行精确设置。(1)设置数据类型3.数据的输入、导入和引用合适的字体和对齐方式,有助于数据信息的表达。当我们需要设置数据的字体或对齐方式时,可选择数据所在的单元格区域,在“开始”选项卡的“字体”组或“对齐方式”组中进行设置,也可单击各组的“展开”按钮打开“设置单元格格式”对话框中对应的选项卡,在其中进行精确设置。其中,“字体”组打开“设置单元格格式”对话框的“字体”选项卡,“对齐方式”组打开“设置单元格格式”对话框的“对齐”选项卡。(2)设置数据字体和对齐方式3.数据的输入、导入和引用单元格中的数据可以进行格式设置,单元格本身也可以设置边框和填充格式。我们同样可以借助上图中的“边框”选项卡和“填充”选项卡设置单元格格式,也可以按照以下两种方法快速为单元格应用样式。应用单元格样式。选择单元格或单元格区域,在“开始”/“样式”组的“单元格样式”下拉列表框中选择某种样式。套用表格格式。选择需要套用表格格式的单元格区域,在“开始”/“样式”组中单击“套用表格格式”按钮。(3)美化单元格项目任务任务1 让八瓜鱼帮忙采集数据下面以京东的“商品搜索”模板为例,介绍模板采集的实现方法,其具体操作如下。用新建模板任务使用京东商品搜索模板项目任务任务1 让八瓜鱼帮忙采集数据用设置采集参数项目任务任务1 让八瓜鱼帮忙采集数据用选择采集方式完成数据采集指定导出方式设置导出位置和文件名称项目任务任务1 让八瓜鱼帮忙采集数据用导出完成查看采集到的数据项目任务任务2 数据类型转换及格式化处理下面练习对采集到Excel中的数据进行设置,通过本任务将练习到包括行高、列宽、字体格式、对齐方式、数据类型、边框格式、填充格式等一系列数据格式设置的方法,设置前后的对比效果如下图所示。用项目任务任务2 数据类型转换及格式化处理用设置单列列宽精确设置列宽值项目任务任务2 数据类型转换及格式化处理用设置多列列宽精确设置多列列宽值项目任务任务2 数据类型转换及格式化处理用加粗字体设置带1位小数的百分比数据类型项目任务任务2 数据类型转换及格式化处理用添加外边框设置填充颜色目录采集数据项目4.1 加工数据项目4.2 分析数据项目4.3 初识大数据项目4.4 相关知识相关知识1.数据清理2.数据计算3.数据管理项目4.2 加工数据1.数据清理选择数据所在的单元格或单元格区域,在“开始”/“数字”组的“数据类型”下拉列表框中选择需要的类型选项。如果该组中现有的参数和按钮无法满足需要,可单击“展开”按钮,在打开的“设置单元格格式”对话框的“数字”选项卡中进行精确设置。(1)设置数据类型1.数据清理数据清理主要是对重复的数据进行筛选清除,将缺失的数据补充完整,对错误的数据更正等。2.数据计算数据计算是指对数据进行各种算术和逻辑运算,以便得到进一步的有用信息。在Excel中,数据计算最常用的方法是使用公式和函数进行运算。使用公式:使用函数:3.数据管理数据管理是指对数据进行排序、筛选、分类汇总等操作,通过这些操作可以将数据加工成数据分析时需要的内容。数据排序:3.数据管理数据筛选:数据分类汇总:项目任务任务1 清理重复数据并计算培训成绩本任务将利用Excel的“删除重复项”功能清理表格中的重复数据,然后利用公式和函数计算每个学生的培训成绩,制作后的表格参考效果如下图所示。用项目任务任务1 清理重复数据并计算培训成绩单击“删除重复项”按钮指定检查重复项的两个项目项目任务任务1 清理重复数据并计算培训成绩选择“SUM”选项选择单元格区域项目任务任务1 清理重复数据并计算培训成绩输入公式填充公式项目任务任务2 管理计算机配件价格数据本任务将练习在表格中对计算机配件按价格进行排序,筛选出指定配件的价格数据,并对各类配件的平均价格进行分类汇总,制作后的参考效果如下图所示。用项目任务任务2 管理计算机配件价格数据用单击“排序”按钮设置主要关键字项目任务任务2 管理计算机配件价格数据用设置次要关键字排序结果项目任务任务2 管理计算机配件价格数据用按数字筛选自定义筛选项目任务任务2 管理计算机配件价格数据用设置分类汇总查看汇总结果目录采集数据项目4.1 加工数据项目4.2 分析数据项目4.3 初识大数据项目4.4 相关知识相关知识1.数据可视化与分析方法2.图表的类型与组成项目4.3 分析数据1.数据可视化与分析方法常用的可视化分析方法主要有以下几种。对比分析:1.数据可视化与分析方法趋势分析:1.数据可视化与分析方法占比分析: 分布分析:2.图表的类型与组成一般来说,数据对比可视化分析时,常用到的图表类型有柱形图、条形图等;数据对比可视化分析时,常用到的图表类型有折线图、面积图等;数据占比可视化分析时,常用到的图表类型有饼图、圆环图等;数据分布可视化分析时,常用到的图表类型有散点图、气泡图、直方图等。下图即为二维柱形图。项目任务任务1 综合应用多种图表分析数据本任务将利用柱形图、折线图和饼图依次分析材料采购表格中上半年各材料的采购量对比情况、单个材料的采购量趋势变化情况,以及不同类别材料的采购量占比情况,制作后的参考效果如右图所示。用项目任务任务1 综合应用多种图表分析数据用自动求和选择图表类型项目任务任务1 综合应用多种图表分析数据用设置坐标轴应用图表样式项目任务任务1 综合应用多种图表分析数据用设置数据系列格式选择图表类型项目任务任务1 综合应用多种图表分析数据用美化图表添加数据标签项目任务任务1 综合应用多种图表分析数据用复制数据选择图表样式项目任务任务1 综合应用多种图表分析数据用设置图表样式和标题设置数据标签项目任务任务2 使用数据透视图表对象分析数据下面便在表格中创建数据透视表和数据透视图对象,使用它们来分析数据,如下图所示。用项目任务任务2 使用数据透视图表对象分析数据用创建数据透视表指定数据透视表位置项目任务任务2 使用数据透视图表对象分析数据用添加字段更改字段项目任务任务2 使用数据透视图表对象分析数据用移动图表指定图表位置和名称项目任务任务2 使用数据透视图表对象分析数据用调整字段筛选数据项目任务任务2 使用数据透视图表对象分析数据用电风扇各季度销量趋势各家电全年销售占比项目任务任务2 使用数据透视图表对象分析数据用设置数据标签目录采集数据项目4.1 加工数据项目4.2 分析数据项目4.3 初识大数据项目4.4 相关知识相关知识1.大数据基础知识2.大数据采集3.大数据分析项目4.4 初识大数据1.大数据基础知识总体而言,大数据发展经历了4个重要的阶段。(1)发展1.大数据基础知识大数据是海量、高速增长和多样化的信息资产,它具有数据体量大、数据类型多、数据产生速度快、数据价值密度低等特点。(2)特点1.大数据基础知识(3)用途电商大数据零售大数据农业大数据金融大数据交通大数据教育大数据医疗大数据生物大数据2.大数据采集物联网的数据大部分是非结构化数据和半结构化数据,采集的方式主要包括报文和文件两种。报文是根据用户设置的采集频率进行数据传输,并将数据信息存放到消息总线中实现采集;文件则是通过各种物联网设备连续不断地发送数据,并形成一个或多个文件以便采集。(1)物联网系统数据的采集2.大数据采集互联网系统是另一个重要的数据采集渠道,整个互联网系统涵盖了大量的数据,并且这些数据的价值密度较高。目前,针对互联网系统的数据采集通常是通过网络“爬虫”工具来实现,例如可以通过Python或Java语言来完成“爬虫”的编写,通过在“爬虫”上增加一些智能化的操作,将非结构化的信息从大量的网页中抽取出来以结构化的方式存储,或直接存入本地数据库中,以实现自动采集工作。(1)互联网系统数据的采集3.大数据分析大数据分析的过程通常包括数据采集、导入、预处理、统计分析、展现等步骤。在合适的工具辅助下,对不同类型的数据源进行融合、取样和分析,按照一定的标准统一存储数据,并通过去噪等数据分析技术对其进行降维处理,然后进行分类,最后提取信息,选择可视化认证等方式将结果展示给终端用户。项目任务大数据在生活中的应用请根据自己的所见所闻,将大数据在生活中的应用情况填写到表4-1中。用日常生活 大数据应用情况饮食出行学习运动就职医疗租房购物娱乐感谢聆听信息技术(基础模块)(下册) 展开更多...... 收起↑ 资源预览