资源简介 中小学教育资源及组卷应用平台信息技术 第9课 常见的数据处理过程课题 常见的数据处理过程 单元 第二单元 学科 信息技术 年级 七年级教材分析 《常见的数据处理过程》该课时教材编排了“有效处理数据的方法→数据处理的基本方法”的系列学习活动,通过实践与探究了解有效处理数据的方法和数据处理的基本方法,学会如何进行数据合并和数据清洗,进行数据分析更深入地了解数据背后的意义。教材编排合理,教学环节注重实践与理论相结合,教材内容贴近学生生活实际,符合七年级学生认知特点。教学目标 1、信息意识:学习有效处理数据的方法,解决数据不完整、不一致、重复等问题,保证数据的真实性。 2、计算思维:了解数据处理完整过程,分析数据创建好数据分类集,了解数据背后的意义。 3、数字化学习与创新:能够将现有的技术应用于实际场景中,使用辅助工具进行数据处理。 4、信息社会责任在工作学习中积极促进社会公正、可持续发展,并通过数据分析为社会做出积极贡献。重点 一、有效处理数据的方法二、数据处理的基本方法难点 1、数据处理的基本方法教学过程教学环节 教师活动 学生活动 设计意图导入新课 在准备“一带一路”主题报告过程中我们收集了大量的相关资料,这些资料有些需要合并对比,有些存在不完整、不一致、重复等问题。面对这样的数据表格,如何将其整理成符合需要的数据呢? 在“从数据看‘一带一路’”的主题分析报告准备过程中,我们应该如何以数据深入阐述主题,又如何进行数据分析与加工呢?知识拓展 学生之间相互讨论如何解决数据重复等问题。 帮助学生了解数据处理概念,打开课堂。讲授新课 一 、有效处理数据的方法数据处理是数据分析过程中的关键环节,直接影响到分析建模的效率为了确保数据的准确性和完整性,我们需要收集庞杂的数据,并对数据进行整理和清洗。为了更好地组织和理解数据,我们需要对数据进行分类和合并这可能涉及按照一定规则进行分组、合并或排序。此外,为了进行后续的数据分析,我们还需要进行数据转换和计算。数据处理过程可以大致分为数据合并、数据清洗、数据变换、数据标准化四个基本步骤。数据合并能将数据进行简单归类,为分析数据创建好数据分类集;数据清洗可以将数据中的缺陷、错误数据等问题处理掉,最大限度地提高数据分析结果的准确度;数据变换可以将数据加工成建模时需要的形式,为数据建模做准备。通常数据标准化和数据变换作为同一步骤执行。知识拓展数据分析的结果可以应用在哪些领域?二 、数据处理的基本方法深度融入“一带一路”倡议已经成为各地谋篇布局的“重头戏”,各地参与“一带一路”建设的积极性和主动性显著提升。图2-16是2017年我国四大区域与共建“一带一路”国家贸易额及占本区域对外贸易的比重,在整理这部分数据时,需要将两组数据按照区域进行合并,我们应该如何操作呢?1.合井数据集 在数据处理过程中,经常会对数据进行合并。如图2-16中的两组数据首先要进行合并。可以实现合并的工具很多,上一课我们用的电子表格工具可以继续使用。 操作提示:数据获取可能来自不同的渠道,或者不同角度,需要进行合并处理。如图2-17所示,将两个表格放在一个工作表中。2.数据清洗 处理数据缺失值、删除重复数据和修正异常值是数据清洗的三个主要表现方面。想要在数据清洗方面做得更好,需要具备严谨的态度和所探究领域全面、系统的知识,也需要在数据探索的道路上不断积累成功的经验和失败的教训。“一带一路”大数据指数中,“海上丝路”贸易指数由宁波航运交易所开发编制,数据来源于海关月度进出口贸易数据,由出口贸易指数、进口贸易指数、进出口贸易指数构成,并从总体贸易指数、区域贸易指数、特类贸易指数等不同方面衡量中国对外经贸发展水平,反映中国对外贸易发展变化趋势。请观察表2-3,你发现了什么问题?(1)数据缺失值的检测。数据缺失是指数据中某个或某些特征的值是不完整的,这些值称为缺失值。造成数据缺失的原因很多,可能是由于疏忽或遗漏无意造成的,也可能是某些数据特征根本不存在等。在很多数据应用场景中都会碰到数据缺失的情况。(2)处理重复数据。由于数据分布、数据共享等原因,在数据的采集和处理过程中,会产生大量的重复数据,增加存储成本。 重复数据包括记录重复、特征重复两种类型。记录重复是指对数据进行检测,存在多行数据,其中存在一个或多个特征的值完全相同的情况。特征重复是指数据中存在一个或多个行/列名称不同但数据完全相同的情况,如表2-3所列。 对重复数据的有效检查和删除,在不损坏数据真实性和完整性的前提下,可以减少重复数据对存储成本的影响,以优化和节省更多的存储空间。(3)异常值处理。如表2-3所列,可以去掉重复数据,也可以尝试在电子表格中删除数据行。异常值是指数据中存在的不合理的个别值。产生异常值的主要原因包括人为错误和自然错误两大类。数据录入错误属于人为错误而数据采集过程中由于外部干扰产生的数据错误则为自然错误。 如何处理这些异常值? 我的处理方法:根据数据特征将数据进行分组处理,在每个组内独立地检测和处理异常值,避免全局操作导致误删或误改正常数据。在进行自动处理之前,最好由专业人员对可能存在的异常情况进行仔细审查,并根据领域知识做出合理判断。除电子表格外,也有其他处理数据的工具,在后面的学习中会接触到。知识拓展现有一个混合了多种不同类型数据的大型数据集,我们应该如何处理和分析它?三、拓展与深化 想要通过数据直观展现我国与共建“一带一路”国家的经济合作情况,同学们可以访问中国一带一路网,并关注其“数据”板块下的“各国数据”区域。在这里,你们可以设置感兴趣的合作国家,比如,选择“波兰”作为研究对象,并选择“起止时间”和相关的经济指标进行查询。平台将以图表的形式,展示出所选时间段内,中国与波兰在多个关键领域的合作情况,包括但不限于中国对波兰进出口的活跃度、中国对波兰直接投资的存量规模增长趋势,以及双方港口间集装箱吞吐量的变动情况(如图2-19)单击图表上方的“表格下载”按钮,即可下载数据表格,进而对数据进行更深入的分析。这种数据驱动的视角,能够帮助我们对两国合作情况一个全面而深入的了解,揭示出两国间经济合作的广度、深度及发展趋势。仿照上述操作方法,通过访问中国一带一路网并利用其提供的数据和信息,深入分析我国与某一个或几个共建“一带一路”国家的经济合作情况。①我选择的国家是:尼泊尔。②我选择的指标是:对中国出口。③我的结论是:从2022年开始至现在呈持续上升趋势。 进行数据分析的目的,是了解数据背后的意义。通过以上数据,可以看到“一带一路”倡议对周边国家经济的影响以及我国做出的巨大贡献。四 、知识拓展 1、关于数据处理的AI工具。2、数据资料审核的主要方法?3、数据的表现形式有哪些?五、课堂练习在处理混合数据集时,如何确保不同类型数据之间的兼容性和一致性? 学生之间互相讨论有效处理数据的方法。学生通过观看课件和听老师讲解,学习数据处理的基本方法。 学生课堂通过实践查询自己学习如何查询数据,了解数据背后的意义。学生通过观看视频和自我思考数据资料审核的主要方法。学生查找资料,相互讨论对于本堂课中老师提出的问题进行解答。 帮助学生积极融入课堂,提高学生学习积极性。学生通过边看边听的形式了解数据处理的基本方法。 打开学生思维、让学会生了个积极思考,进一步理解课堂内容。让学生通过视频思考,进一步加深对课堂所学内容的理解。 让学生巩固本堂课的内容,加深学生对所学知识的印象。布置作业 将“一带一路”主题报告中搜集的资料进行合并对比,筛选出不正确和重复的资料。 完成作业 培养学生查阅资料的能力,分析解决问题的能力课堂小结 通过常见的数据处理过程的课程,我们深刻知道数据处理是数据分析过程中的关键环节,直接影响到分析建模的效率,所以我们必须要针对数据资料进行合并对比筛选出不正确及重复的数据。通过实践与探究我们学习了有效处理数据的方法和数据处理的基本方法,学会了如何进行数据合并和数据清洗,进行了数据分析我们将更深入地了解数据背后的意义。 分组总结归纳 锻炼学生的总结能力,逻辑思维、语言表达能力。板书 一、有效处理数据的方法二、数据处理的基本方法 学习、记忆及勾画知识点 明确教学内容及重点和难点21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)(共34张PPT)第9课常见的数据处理过程(河北大学出版社)七年级01教学目标02问题情境03实践与探究04拓展与深化05拓展延伸06课堂练习07课堂小结08板书设计01教学目标1、信息意识:学习有效处理数据的方法,解决数据不完整、不一致、重复等问题,保证数据的真实性。2、计算思维:了解数据处理完整过程,分析数据创建好数据分类集,了解数据背后的意义。3、数字化学习与创新:能够将现有的技术应用于实际场景中,使用辅助工具进行数据处理。4、信息社会责任:在工作学习中积极促进社会公正、可持续发展,并通过数据分析为社会做出积极贡献。02问题情景在准备“一带一路”主题报告过程中我们收集了大量的相关资料,这些资料有些需要合并对比,有些存在不完整、不一致、重复等问题。面对这样的数据表格,如何将其整理成符合需要的数据呢?02问题情景知识拓展03实践与探究—有效处理数据的方法数据处理是数据分析过程中的关键环节,直接影响到分析建模的效率为了确保数据的准确性和完整性,我们需要收集庞杂的数据,并对数据进行整理和清洗。为了更好地组织和理解数据,我们需要对数据进行分类和合并这可能涉及按照一定规则进行分组、合并或排序。此外,为了进行后续的数据分析,我们还需要进行数据转换和计算。03实践与探究—有效处理数据的方法数据处理过程可以大致分为数据合并、数据清洗、数据变换、数据标准化四个基本步骤。数据合并能将数据进行简单归类,为分析数据创建好数据分类集;数据清洗可以将数据中的缺陷、错误数据等问题处理掉,最大限度地提高数据分析结果的准确度;数据变换可以将数据加工成建模时需要的形式,为数据建模做准备。通常数据标准化和数据变换作为同一步骤执行。03知识拓展数据分析的结果可以应用在哪些领域?商业和市场营销:可以了解消费者行为、市场趋势和竞争对手情况,从而制定更有效的营销策略、优化产品定位和提升销售业绩。金融服务:可以利用数据分析来进行风险评估、欺诈检测、客户信用评级等,帮助管理风险并提供更好的服务。医疗保健:可以利用数据分析来改善患者治疗方案、预测疾病传播趋势、优化资源配置等,提高医疗服务质量。实践与探究—有效处理数据的方法03知识拓展数据分析的结果可以应用在哪些领域?政府与公共服务:政府部门可以利用数据分析来改善城市规划、交通管理、社会福利发放等公共服务领域,提高政府效率和民生福祉。物流与供应链管理:企业可以通过数据分析优化物流运输路线、库存管理和供应链协调,降低成本并提高效率。环境保护:通过数据分析监测空气质量、水质污染情况等环境指标,制定环境保护政策并采取相应措施。实践与探究—有效处理数据的方法03知识拓展实践与探究—有效处理数据的方法03实践与探究—数据处理的基本方法深度融入“一带一路”倡议已经成为各地谋篇布局的“重头戏”,各地参与“一带一路”建设的积极性和主动性显著提升。图2-16是2017年我国四大区域与共建“一带一路”国家贸易额及占本区域对外贸易的比重,在整理这部分数据时,需要将两组数据按照区域进行合并,我们应该如何操作呢?图2-16 2017年四大区域与共建“一带一路”国家贸易额及占本区域对外贸易的比重数据来源:国家信息中心“一带一路”大数据中心《“一带一路”大数据报告(2018)》,商务印书馆2018年。03实践与探究—数据处理的基本方法1.合并数据集在数据处理过程中,经常会对数据进行合并。如图2-16中的两组数据首先要进行合并。可以实现合并的工具很多,上一课我们用的电子表格工具可以继续使用。操作提示:数据获取可能来自不同的渠道,或者不同角度,需要进行合并处理。如图2-17所示,将两个表格放在一个工作表中。03实践与探究—数据处理的基本方法根据第一个数据表的“区域”序列,将数据进行合并。可以复制粘贴,或者在单元格中输入内容,如图2-18所示。图2-18 合并数据图2-17 选择数据03实践与探究—数据处理的基本方法2.数据清洗处理数据缺失值、删除重复数据和修正异常值是数据清洗的三个主要表现方面。想要在数据清洗方面做得更好,需要具备严谨的态度和所探究领域全面、系统的知识,也需要在数据探索的道路上不断积累成功的经验和失败的教训。03实践与探究—数据处理的基本方法“一带一路”大数据指数中,“海上丝路”贸易指数由宁波航运交易所开发编制,数据来源于海关月度进出口贸易数据,由出口贸易指数、进口贸易指数、进出口贸易指数构成,并从总体贸易指数、区域贸易指数、特类贸易指数等不同方面衡量中国对外经贸发展水平,反映中国对外贸易发展变化趋势。请观察表2-3,你发现了什么问题?表2-3 “海上丝路”贸易指数情况数据来源:中国一带一路网。03实践与探究—数据处理的基本方法(1)数据缺失值的检测。数据缺失是指数据中某个或某些特征的值是不完整的,这些值称为缺失值。造成数据缺失的原因很多,可能是由于疏忽或遗漏无意造成的,也可能是某些数据特征根本不存在等。在很多数据应用场景中都会碰到数据缺失的情况。03实践与探究—数据处理的基本方法(2)处理重复数据。由于数据分布、数据共享等原因,在数据的采集和处理过程中,会产生大量的重复数据,增加存储成本。重复数据包括记录重复、特征重复两种类型。记录重复是指对数据进行检测,存在多行数据,其中存在一个或多个特征的值完全相同的情况。特征重复是指数据中存在一个或多个行/列名称不同但数据完全相同的情况,如表2-3所列。对重复数据的有效检查和删除,在不损坏数据真实性和完整性的前提下,可以减少重复数据对存储成本的影响,以优化和节省更多的存储空间。03实践与探究—数据处理的基本方法(3)异常值处理。如表2-3所列,可以去掉重复数据,也可以尝试在电子表格中删除数据行。异常值是指数据中存在的不合理的个别值。产生异常值的主要原因包括人为错误和自然错误两大类。数据录入错误属于人为错误而数据采集过程中由于外部干扰产生的数据错误则为自然错误。如何处理这些异常值?03实践与探究—数据处理的基本方法除电子表格外,也有其他处理数据的工具,在后面的学习中会接触到。我的处理方法:根据数据特征将数据进行分组处理,在每个组内独立地检测和处理异常值,避免全局操作导致误删或误改正常数据。在进行自动处理之前,最好由专业人员对可能存在的异常情况进行仔细审查,并根据领域知识做出合理判断。03知识拓展现有一个混合了多种不同类型数据的大型数据集,我们应该如何处理和分析它 1. 数据准备:处理缺失值、异常值和错误。将数据转换为适当的类型(例如,将字符串转换为数字)。创建新的特征或转换现有特征,以提高模型性能。2. 数据建模:根据数据类型和分析目标选择监督学习、非监督学习或预测建模技术。识别与目标变量最相关的特征。训练模型并使用评估指标(例如准确度、召回率、F1 分数)评估其性能。实践与探究—数据处理的基本方法03知识拓展现有一个混合了多种不同类型数据的大型数据集,我们应该如何处理和分析它 3. 数据探索:计算平均值、中位数、标准差等统计指标。使用图表和图形探索数据的分布和模式。确定不同变量之间的关系。4. 处理不同数据类型:使用统计方法(例如回归、聚类)进行分析。使用时间序列分析技术(例如ARMA、SARIMA)进行预测。使用面板数据分析技术(例如固定效应、随机效应)处理相关性。实践与探究—数据处理的基本方法03知识拓展实践与探究—数据处理的基本方法04拓展与深化想要通过数据直观展现我国与共建“一带一路”国家的经济合作情况,同学们可以访问中国一带一路网,并关注其“数据”板块下的“各国数据”区域。在这里,你们可以设置感兴趣的合作国家,比如,选择“波兰”作为研究对象,并选择“起止时间”和相关的经济指标进行查询。平台将以图表的形式,展示出所选时间段内,中国与波兰在多个关键领域的合作情况,包括但不限于中国对波兰进出口的活跃度、中国对波兰直接投资的存量规模增长趋势,以及双方港口间集装箱吞吐量的变动情况(如图2-19)单击图表上方的“表格下载”按钮,即可下载数据表格,进而对数据进行更深入的分析。04拓展与深化图2-19 中国与波兰在多个关键领域的合作情况这种数据驱动的视角,能够帮助我们对两国合作情况一个全面而深入的了解,揭示出两国间经济合作的广度、深度及发展趋势。04拓展与深化仿照上述操作方法,通过访问中国一带一路网并利用其提供的数据和信息,深入分析我国与某一个或几个共建“一带一路”国家的经济合作情况。①我选择的国家是:尼泊尔。②我选择的指标是:对中国出口。③我的结论是:从2022年开始至现在呈持续上升趋势。进行数据分析的目的,是了解数据背后的意义。通过以上数据,可以看到“一带一路”倡议对周边国家经济的影响以及我国做出的巨大贡献。05拓展延伸1、关于数据处理的AI工具。05拓展延伸2、数据资料审核的主要方法?经验判断:根据已有经验,判断数据的真实、准确。逻辑检查:根据项目之间的内在联系和实际情况,看是否有不合理或前后矛盾。计算审核:对数据资料的计算技术和有关指标之间的相互关系进行审查,看计算方法和计算结果有无错误。05拓展延伸3、数据的表现形式有哪些?(1)表格:表格是最基本的数据展示形式,通常用于呈现结构化数据。通过行和列的方式展示数据,便于比较和分析。(2)图表:图表是将数据以可视化方式呈现的方法,包括折线图、柱状图、饼图等。不同类型的图表适用于展示不同类型的数据关系。(3)地图:地图可以用来展示地理位置相关的数据,如人口分布、销售地域等。通过颜色或符号来表示不同区域的数值差异。05拓展延伸3、数据的表现形式有哪些?(4)文字描述:有时候简单的文字描述也可以有效传达信息,特别是在解释复杂概念或结果时。(5)动画和交互式可视化:这种形式可以更生动地展示数据变化,并让用户参与其中进行探索和互动。(5)报告和演示文稿:将数据整理成报告或演示文稿形式,逐步阐述问题、分析结果和提出建议。这种形式适合对结果进行详细解释和讨论。(6)音频/视频内容:有时候也可以通过音频或视频内容来传达信息,例如播客、视频教程等形式。06课堂练习在处理混合数据集时,如何确保不同类型数据之间的兼容性和一致性?数据类型验证:使用数据类型验证函数检查并确保数据类型与预期的一致。对于大型数据集,可以使用数据验证库或工具。数据预处理:应用特定于不同数据类型的预处理技术。例如,对于文本数据,可以进行分词、词干提取和去停用词。数据可视化:使用适合不同数据类型的可视化技术。如使用条形图和饼状图可视化定性数据,使用散点图和折线图可视化定量数据。07课堂小结通过常见的数据处理过程的课程,我们深刻知道数据处理是数据分析过程中的关键环节,直接影响到分析建模的效率,所以我们必须要针对数据资料进行合并对比筛选出不正确及重复的数据。通过实践与探究我们学习了有效处理数据的方法和数据处理的基本方法,学会了如何进行数据合并和数据清洗,进行了数据分析我们将更深入的了解数据背后的意义。08板书设计常见的数据处理过程一、有效处理数据的方法二、数据处理的基本方法课后作业1、将“一带一路”主题报告中搜集的资料进行合并对比,筛选出不正确和重复的资料。https://www.21cnjy.com/recruitment/home/fine 展开更多...... 收起↑ 资源列表 如何进行数据筛选.mp4 数据处理流程.mp4 数据处理的AI工具.mp4 数据处理的重要性.mp4 第9课 常见的数据处理过程.doc 第9课 常见的数据处理过程.pptx