第五章《数据处理和可视化表达》单元 教学设计 2023—2024学年粤教版(2019)高中信息技术必修1

资源下载
  1. 二一教育资源

第五章《数据处理和可视化表达》单元 教学设计 2023—2024学年粤教版(2019)高中信息技术必修1

资源简介

第五章 数据处理和可视化表达 大单元教学设计
一、项目简介
项目主题 典型城市空气质量变化研究
项目背景 2020 年 9 月 22 日在 75 届联合国大会上我国提出将努力在 2060 年实现 “碳中和”, 2021 年 “碳达标”和“碳中和”首次写入政府工作报告, 2022 年 10 月 16 日召开的二十大也再次提到了碳达标。近几年,我国各地方 政府先后采取了一系列措施整治环境,各个城市空气质量也都有了明显的改 善,中国对空气质量的严格要求对推动全球气候治理起到关键性的推动作 用。本项目以大数据为依托,对各典型城市的空气质量数据进行采集和分 析,进而探究数据背后的真相。
对应教材 粤教版信息技术必修 1《数据与计算》第五章 课时安排 4 课时
二、课程标准及目标分析
(一)课程标准及教材分析
1. 本章对应课标的内容要求
通过典型的应用实例,了解数据采集、分析和可视化表达的基本方法。
根据任务需求,选用恰当的软件工具或平台处理数据,完成分析报告,理解对数据进行保护 的意义。
2. 本章对应的学业要求
A-1:能够描述数据与信息的特征。(信息意识)
A-3:能够根据需要选用合适的数字化工具开展学习。(数字化学习与创新)
A-4:了解数据采集、分析和可视化表达的基本方法。(计算思维)
A-5:能够利用软件工具或平台对数据进行整理、组织、计算与呈现,并能通过技术方法对 数据进行保护。(计算思维、信息社会责任)
A-6:在数据分析的基础上,完成分析报告。(计算思维)
3. 本章的地位和作用
本章是本教科书的第五章,将带领学生学习“数据处理和可视化表达”的教学内容,也是学 习选择性必修模块《数据管理与分析》和《人工智能初步》的基础知识与技能准备。本章以培养 信息素养为目标,以知识技能为载体,以项目学习活动为途径,开展自主、协作、探究学习,让 学生了解数据采集、分析和可视化表达的基本方法。
本章以“典型城市空气质量变化研究”为项目范例,通过“典型城市空气质量变化研究”项 目,让学生认识和了解大数据,学会选用恰当的软件工具或平台处理数据、发现信息,已逐步成 为人们解决问题的一种重要方式;并通过对数据和大数据进行采集、存储、处理,以及从中发掘 有价值的信息等过程,让学生全面了解数据与计算的重要意义,从而提升学生的信息素养。
(二)本章对应达成的学科核心素养
(1)针对特定的信息问题,自觉、主动比较不同的信息源,能描述数据与信息的关系,确 定合适的信息获取策略。(信息意识 1)
(2)依据特定任务需求,甄别不同信息获取方法的优劣,并能利用适当途径甄别信息。 (信息意识 1)
(3)在日常生活中,根据实际解决问题的需要,恰当选择数字化工具,具备信息安全意 识。(信息意识 1)
(4)主动关注信息技术工具发展中的新动向和新趋势,有意识地使用新技术处理信息。 (信息意识 1)
(5)针对给定的任务进行需求分析,明确需要解决的关键问题。(计算思维 1)
(6)按照问题解决方案,选用适当的数字化工具或方法获取组织分析数据,并能迁移到其 他相关问题的解决过程中。(计算思维 1)
(7)在学习过程中能够评估常用的数字化工具资源,根据需要合理选择。(数字化学习与 创新 1)
(8)在信息活动中,具有信息安全意识,尊重和保护个人及他人的隐私(信息社会责任 1)
(三) 目标分析
1. 项目目标
本章以“典型城市空气质量变化研究”为项目范例,通过“典型城市空气质量变化研究”项 目,组织学生进行自主、协作、探究学习,让学生认识大数据及其特征、理解数据对日常生活的 影响,了解数据采集的基本方法及其对数据保护的意义,能够在一大批杂乱无章的数据中,运用 数字化的工具和技术分析数据,并学会选用恰当工具实现数据的可视化表达,以便更好的理解数 据。学习过程将知识建构、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程 中,促进本章对应课标的学科核心素养水平的达成,完成项目学习目标。
2. 学业目标
(1)能够了解大数据的概念;
(2)能够理解大数据的特征;
(3)能够了解大数据对日常生活的影响;
(4)能够明晰传统数据与大数据的区别;
(5)能够明确数据应用项目的需求,能制定数据采集的需求清单;
(6)能够了解数据采集的方法和工具;
(7)能够理解对数据保护的意义;
(8)能够了解数据预处理及分析;
(9)能够体验多种数据分析技术;
(10)能够掌握选用恰当的工具处理数据;
(11)能够掌握总结和归纳数据分析的方法和步骤;
(12)能够了解数据可视化的两种类型;
(13)能够学会选用恰当的工具可视化表达数据,揭示数据反映的本质问题,提升数据分析
的效率;
(14)能够撰写数据分析报告。
重点:
(1)了解数据采集的方法和工具;
(2)了解数据预处理及分析;
(3)体验多种数据分析技术;
(4)选用恰当的工具可视化表达数据,揭示数据反映的本质问题,提升数据分析的效率。 难点:
(1)体验多种数据分析技术;
(2)选用恰当的工具可视化表达数据,揭示数据反映的本质问题,提升数据分析的效率。
三、学情分析
学生在第四章已经体验了利用程序去解决问题。了解了 python 程序设计语言的基础知识,
掌握了程序的顺序结构、选择结构和循环结构,学会了使用程序设计语言实现简单算法,体验了 程序设计基本流程,掌握了程序调试与运行的方法。
四、教学方法和策略
创设数据处理和可视化表达的活动情境,组织学生在解决问题的过程中探究数据采集、数据 分析和数据可视化表达的方法,通过小组学习选用恰当的软件工具或平台处理数据,完成分析报 告发展学生的计算思维,提升学生的数字化学习与创新能力。
五、资源列表

资源名称 清单及描述 形式(类型) 来源
课件 第五章 数据处理和可视化表达 (课件) 演示文稿 教师制作
微课 5-3 聚类分析程序介绍 微课视频 教师制作
学习资料 《近十年气象变化》 《探究大数据特征》 文档、视频 教师准备
软件工具 后羿采集器 软件 互联网
六、学习活动流程
七、学习活动设计
范例学习
项目主题
典型城市空气质量变化研究
项目背景
2020 年 9 月 22 日在 75 届联合国大会上我国提出将努力在 2060 年 实现“碳中和”, 2021 年 “碳达标”和“碳中和”首次写入政府工作 报告, 2022 年 10 月 16 日召开的二十大也再次提到了碳达标。近几
年,我国各地方政府先后采取了一系列措施整治环境,各个城市空气 质量也都有了明显的改善,中国对空气质量的严格要求对推动全球气
候治理起到关键性的推动作用。本项目以大数据为依托,对各典型城
市的空气质量数据进行采集和分析,进而探究数据背后的真相。
项目目标
4
项目选题 项目规划 活动探究 项目实施 通过项目的完成,认识大数据及其特征,认识大数据对人们日常 生活的影响,了解数据采集、分析和可视化表达的基本方法;学会选 用恰当的软件工具或平台处理数据,完成分析报告;理解对数据进行 保护的意义,从而实现项目学习的目标。 工具和方法 组建团队、明确任务;采用 Python 语言和数据分析方法等,实 施探究。 实施过程 (1) 明确项目问题 (2) 规划设计:制订项目学习的学习规划 (3) 探究活动:通过探究活动了解数据采集、分析和可视化表达的 基本方法;学会选用恰当的软件工具或平台处理数据,完成分析报告。 (4)作品制作:“典型城市空气质量变化研究”可视化报告 (5)成果交流 (6)活动评价 ◆ 成果 “典型城市空气质量变化研究”可视化报告
教师活动 提供选题,并参与到小组的选题及立题目的讨论中。 学生活动 根据教师提供的项目背景选题或自拟,小组头脑风暴后确定项目 选题及研究目的,以小组为单位,填写《项目学习活动记录表》“项 目选题”栏目。
教师活动 强调项目目标及学习目标,引导学生分析项目问题,指导小组完 成项目规划,组织开展方案交流。 学生活动 小组依照项目范例,结合本组选题,制订本组项目规划方案,填 写《项目学习活动记录表》“项目规划”栏目。
第一课时 一、创设情景,视频导入课程 教师活动

教师在课程开始之前播放《近十年气象变化》视频,教师根据视 频内容进行提问。 学生活动 学生回答问题 教师活动 教师归纳,评价引入本节课内容 二、任务驱动景,内容讲解 教师活动 教师对大数据的概念进行细化、讲解。 大数据:是指无法在可承受的时间范围内用常规软件工具进行高 效捕捉、管理和处理的信息集合,是需要新处理模式才能具有更强的 决策力、洞察发现力和流程化能力的海量、高增长率和多样化的信息 资产。 学生活动 学生认真听讲,并对大数据概念进行再定义。 活动 1:大数据的基本特征。 教师活动 播放互联网产生大数据的视频,让学生观看视频交流讨论,得出 大数据的 4v 特征 学生活动 观看视频,回答问题 教师活动 数据体量大,数据类型繁多,变化速度快,价值密度低 教师对特征进行详细解读,并结合案例和学生的回答。
活动 2:通过学习任务单中案例,体会大数据对日常生活产生的影 响。

教师活动 展示案例,带领学生分析及交流,让学生自主探讨大数据对人类 日常生活产生的影响。 学生活动 通过案例分析,理解大数据带来的影响:方便支付、方便出行、 方便购物与产品推销、方便看病与诊病,以及个人信息泄露、信息诈 骗、信息伤害等。填写《学习任务单》。 教师活动 教师进行评价和归纳,引入项目
三、项目提出,小组合作 活动 3:提供选题,小组分工讨论并明确项目主题——典型城市空气 质量变化研究。 教师活动 提供项目选题,让学生根据既定的选题确定本章需要探究的项目主题 城市。 学生活动 学生交流讨论确定小组项目城市
四、项目规划,创新发展 教师活动 学生根据项目学习单,参考书本上的项目规划图,完成本组项目规划 图和项目学习单。 数据采集 数据分析 数据可视化分 学生活动
7
各小组成员之间相互讨论,利用思维导图软件,制订本组项目的学习 规划,并完成项目学习单。 五、展示归纳,反思升华 展示各小组的项目规划图,各小组可相互借鉴并修改。展示本节课所 学习内容。同时,请学生课后讨论如何获取大量数据并保存第二课时 一、复习导入 根据上节课的内容,引出本节课的知识——数据的采集。 二、探究活动 口 活动 4:确定项目数据需求。通过查找资料,学习和交流,了解数据 采集的基本方法和常用工具。根据选定的项目主题,确定项目的数据 需求,列出数据采集清单和内容大纲, 教师活动 带领学生了解数据采集的基本方法和常用工具;以项目范例为例,引 导学生对项目问题进行抽象与建模,确定项目需要利用哪些工具来爬取数 据。 ◆ 学生活动 通过学习和交流,借助学习资源,了解传感器采集法及其它数据采集 法,并对小组项目问题进行抽象与建模,小组结合本组选题,分析和确定 本组项目的数据内容需求、数据来源、采集方法和工具以及数据保存形 式,填写《项目学习活动记录表》“探究活动 项目实施”栏目中的“活 动 4”的内容。
活动 5:采集数据。通过学习、交流、探究和实践,结合本小组选 题,了解 Python 第三方库的安装,体验爬虫程序;指导学生安装后羿 采集器,在线爬取网络数据。 ◆ 教师活动 提供项目范例中的 Python 程序代码,介绍有关第三方库模块安装与 使用、爬虫程序采集网络数据的基本操作指引,使用爬虫程序体验爬取宣 城市一天的天气数据;指导学生安装后羿采集器,在线体验采集太原、合

肥、杭州三个主要城市的空气质量指数及其它数据并生成 csv 文件,保存 文件为典型城市.xls,为本项目的数据分析具体实施做好准备。 ◆ 学生活动 通过学习、交流、探究和实践,借助学习资源,认识第三方库的 安装、运行爬虫程序采集宣城市一天的天气数据;利用后羿采集器采 集本项目所需数据,填写《项目学习活动记录表》“探究活动 项目实 施”栏目中的“活动 5”的内容。
第三课时 一、问题引入: (展示上节课采集数据截图)你能从这些图中获取有 用的信息吗?你能发现这些数据内在的结构和规律吗? 二、数据分析 (1)数据预处理 教师活动 引导学生观察图片及发现问题(数据重复和缺失值)。 学生活动 结合发现的问题讲解数据预处理关键代码。 (2)特征值探索 教师活动 结合采集的数据,讲解特征值探索的代码。 学生活动 理解讲授内容。
活动 6:特征探索(数据预处理)。通过学习、交流、探究和实践, 结合本小组选题,对采集到的数据进行预处理,发现和处理缺失值、 处理异常数据、求最值、极差,观察分析数据的分布特征。 教师活动: 引导学生根据学习任务单体验数据预处理。
9
学生活动
通过学习、交流、探究和实践,借助学习资源,小组结合本组选 题,创建数据库,利用程序发现和处理缺失值、处理异常数据填写
《项目学习活动记录表》中“活动 6”相关的内容。
活动 7:特征探索(平均值分析)。通过学习、交流、探究和实践, 结合小组选题,对采集到的数据进行平均值分析。
教师活动
提供项目范例中的 Python 程序代码,提供有关采集的数据集、数 据特征探索基本操作指引(或微课)。通过采集 2016-2021 年的日空 气质量指数数据,讲解特征值(平均值)探索的代码,指导学生计算 年平均空气质量指数,通过对比后观察空气质量是否逐年变好。
学生活动
通过学习、交流、探究和实践,借助学习资源,小组结合本组选 题,利用程序对采集到的网络数据进行平均值分析,同时填写《项目 学习活动记录表》 “活动 7”的内容。
根据项目选题,样表如下:
活动 8:词云图。通过学习、交流、探究和实践,结合小组选题,以 可视化的方式呈现数据。
问题引入:如果我们获取的信息是文本信息,那该如何分析呢?
教师活动
提供项目范例中的 Python 程序代码,指导学生利用词云图可视化 呈现数据;利用词云图可视化呈现程序采集到的文本信息,分析可视 化呈现结果。
学生活动
通过学习、交流、探究和实践,借助学习资源,小组结合本组选 题,利用程序对采集到的网络数据进行可视化呈现,分析数据可视化 呈现结果,同时填写《项目学习活动记录表》“探究活动 项目实施” 栏目中的“活动 8”的内容。
10
第四课时
一、情景导入:
记忆力大挑战:请在 5 秒钟的时间内观察两幅图上的空气质量数 据,分别找出两幅图中空气质量最好的城市。(为什么大家在右图中 很快能找到空气质量最好的城市 右图更直观,数据记忆得更深刻。)
二、 探究活动
活动 9:数据可视化表达的呈现类型,同时填写《项目学习活动记录 表》“探究活动 项目实施”栏目中的“活动 9”的内容。
教师活动:
创造情境,引入可视化概念。给出可视化实例,让学生体验可视化 优点;给出典型案例,分析可视化呈现的类型。
(
主题
)合适的图表
全国人口逐年变化情况
大数据在各行业中的应用比例
比较两位同学的成绩差异
学校周边有图书馆吗?
小说《三国演义》中,哪些人物的出场次数最
学生活动:
体验可视化的直观生动。小组合作探究,根据具体情景,选择合 适的可视化图表。
活动 10:利用 Excel 软件,进行数据的可视化呈现。同时填写《项 目学习活动记录表》“探究活动 项目实施”栏目中的“活动 10”的内 容。
教师活动
分析 Excel 作图的注意要点,展示小组分工任务。
11
空气质量指数年份太原合肥杭州2016998571201710384672018997562201989716120208460512021825949
学生活动 小组结合本组选题,利用 excel 对本小组数据进行可视化呈现, 分析数据可视化呈现结果,同时填写《项目学习活动记录表》“探究 活动 项目实施”栏目中的“活动 10”的内容。
活动 11:使用 Python 编程实现数据的可视化表达。根据老师提供的 项目范例代码,深入体会数据可视化表达方式。通过交流与探究,实现数 据可视化表达。
教师活动 提供项目范例中的 Python 程序代码。引导学生利用程序来实现数 据可视化表达。 #导入 matplotlib 库的 pyplot 子库 import matplotlib.pyplot as plt #定义两个列表用于存储 X 轴和 Y 轴的变量 x=[2016,2017,2018,2019,2020,2021] y=[84,83,75,71,60,59] plt.plot(x,y) #绘制折线图 plt.show() #显示图表
总结:画图代码: 1、柱状图: plt.bar(x,y,width=0.5) 2、散点图: plt.scatter(x,y,s=100,color="green") 3、饼 图: act = ['1','2','3','4','5','6'] plt.pie(x,labels=act) 4、折线图: plt.plot(x,y) 学生活动
12
(
项目范例报告
项目学习活
动记录表
) (
项目范例报告
项目学习活
动记录表
) (
项目范例报告
项目学习活动
记录表
) (
项目活动评价表
作品评价量规
) (
项目活动评价表
作品评价量规
)
项目实施 成果交流 活动评价 小组结合本组项目选题,利用 python 编程对本小组数据进行可视 化呈现,分析数据可视化呈现结果,同时填写《项目学习活动记录 表》“探究活动 项目实施”栏目中的“活动 11”的内容。
各小组参照项目范例的样式,运用数字化学习工具,如用演示文 稿归纳所学知识,梳理探究活动的成果,撰写相应的项目成果报告。
各小组在小组或班级上进行展示与交流,共享创造、分享快乐。
各小组根据项目选题、拟订的项目方案、实施情况以及所形成的 项目成果,利用“作品评价量规”及教科书附录 2 的“项目活动评价 表”,开展项目学习活动评价。
八、学习成果: “典型城市空气质量变化研究”可视化报告
九、评价方案
(一)评价时间线
项目选题 项目规划
探究活动 项目实施
成果交流
活动评价
项目范例报告 项目学习活 动记录表
(二)评价工具
评价方法/工具 评价的过程和目标
项目范例报告 用于整个活动,主要作用是为学生项目实施和作品制作提供示范和引 领。(见附件 1)
项目学习活动记 录表 用于整个学习活动,主要作用是指导学生开展项目学习活动,明确项目 学习内容,记录学习过程及阶段性成果。(见附件 2)
作品评价量规 使用量规项目来帮助学生创作高品质的作品,确保达到项目预期。同时 用量规为同伴的作品提供反馈。教师使用量规来评价。(见附件 3)
项目活动评价表 对整个项目学习过程中各环节,学科核心素养达成的情况进行评价。 (见教科书附录 2)
十、项目实施说明
(一)关于课时分配
建议课时分配如下:
第 1 课时:范例展示、项目选题与项目规划——活动 1、活动 2、活动 3
第 2 课时:探究活动、项目实施——活动 4、活动 5、
第 3 课时:探究活动、项目实施——活动 6、活动 7、活动 8
第 4 课时:项目实施、成果交流评价—活动 9、活动 10、活动 11
(二)关于项目范例
本章教师通过“典型城市空气质量变化研究”项目范例,引导学生学习“数据处理和可 视化表达”。
(三)关于项目选题
围绕本章项目范例“典型城市空气质量变化研究”,根据生活中常见的数据分析和可视 化表达,细化项目学习活动的主题,提供给学生开展学习。
1.杭州市空气质量变化数据分析和可视化表达;
2.太原市空气质量变化数据分析和可视化表达;
3.合肥市空气质量变化数据分析和可视化表达;
(四)关于探究活动
“探究活动”对应项目范例的主题,串联知识点,学生在学习范例的同时自选项目主题,结 合范例学习,完成自选主题的项目探究活动。“探究活动”的设计,使得学生在做项目的过程中 学习知识、建构知识。教师提供记录表单和学习资源对学生的自主探究给予帮助和支持,以提高 学生的学习效率和维持学生的学习兴趣。
十一、附件
附件 1:项目范例可视化报告
典型城市空气质量数据分析报告
一、引言
2020 年 9 月 22 日在 75 届联合国大会上我国提出将努力在 2060 年实现“碳中和”, 2021 年 “碳达标” 和“碳中和”首次写入政府工作报告, 2022 年 10 月 16 日召开的二十大也再次提到了碳达标。近几年,我国 各地方政府先后采取了一系列措施整治环境,各个城市空气质量也都有了明显的改善,中国对空气质量的严格 要求对推动全球气候治理起到关键性的推动作用。本项目以大数据为依托,对各典型城市的空气质量数据进行 采集和分析,进而探究数据背后的真相。
二、分析目的
随着国家对空气质量指数的标准提高,各地政府先后采取了一系列政策和方法治理环境。通过大数据分
析,我们可以了解到三个典型城市的在近几年的空气质量指数变化,进而可以了解到数据背后,政府在治污或 排放工作上的完成力度。通过不同城市的纵向对比,我们还可以更深入地了解本地城市环境治理上存在的问
题。
三、分析内容与步骤
1.分析内容
(1)常见数据的采集。
(2)典型城市空气质量数据分析。
(3)数据的可视化表达方法。
2.分析步骤
(1)确定数据来源。
(2)确定数据分析方法。
(3)用恰当工具可视化表达数据。
四、分析工具和方法
组建团队、明确任务;采用 python 工具和可视化分析工具,实施探究。
五、分析过程
1.确定数据来源
我们所分析的空气质量指数数据,必须来源于某一个天气网站。我们利用 Python 工具中的爬虫模块,对 数据抓取和分析。为了方便体验,我们利用后羿采集器,在线对数据进行抓取和分析。
抓取数据的程序如下所示:
(1)抓取页面设置。
(2)提取天气数据。
(3) 输出及保存数据。
2.确定数据分析方法
数据分析一般包括特征探索、关联分析、聚类与分类、建立模型和模型评价以及其它的数据分析方法 等。
(1)大数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观 察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。
(2)平均分析法是运用计算平均数的方法来反映总体在一定时间、地点等条件下某一数量特征的一般水 平。平均指标是最常用的算术平均数。
(3)词频分析(Word Frequency Analysis)是对文献正文中重要词汇出现的次数进行统计与分析,是文 本挖掘的重要手段。
3.用恰当工具可视化表达数据
大数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛快速通往心灵深处。从常用和 实用的维度,大数据可视化的呈现类型主要分为探索和解释两种不同的类型。探索类型可以帮助人们发现数据 背后的价值,而解释类型则把数据简单明了地解释给人们。按照处理数据类型的不同,可视化呈现的主要方式 如下表所示。
六、分析结果
1.大数据是人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源
大数据的产生是与人类日益普及的网络行为所伴生的:物联网、云计算、移动互联网、车联网、手机、
电脑以及遍布地球各个角落的各种各样的传感器,无一不是数据的来源或是承载的方式。互联网生成的数据
量,不仅远超此前一切人类所生成的数据量的总和,而且在以大爆发性的速度不断增长。大数据成为人们提取 信息、做出决策的重要依据,是推动信息社会发展的重要资源。
2.大数据采集的工具和方法是大数据采集的关键
大数据的来源广泛(主要是互联网和物联网)、类型丰富、规模巨大。采集大数据首先要明确大数据应 用项目的需求,围绕选定的项目主题,制订大数据采集的需求清单和内容大纲,采用适当的方法和工具进行采 集。
大数据作为一种工具,用在什么地方、掌握在谁手里都是次要的,关键是看怎样利用这个工具。在安全 的前提下,实现数据共享,真正创造数据价值,这才是大数据真正的目的。
3. Python 语言是大数据可视化表达的高效工具
在大数据时代,复杂繁多且不同类型的数据大量涌来,往往超出了人们的处理能力,人类的大脑也难以 从堆积如山的数据中快速发现核心问题,而数据可视化可以把枯燥乏味的海量数据以丰富的视觉效果呈现数据 所反映的本质问题,有效提升数据分析的效率。大数据可视化是指以图形、图像、地图、动画等生动、易于理 解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。
大数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛快速通往、心灵深处。大数 据可视化呈现的形式千变万化,实现的工具众多。其中, Python 语言因其开源和包容的特性,嵌入了大量数 据可视化的工具,深受大家的喜爱。
七、结语
本章通过“典型城市空气质量数据分析 ”项目,进行自主、协作、探究学习,让同学们认识大数据及其 特征,了解大数据对人们日常生活的影响。通过对数据采集、分析和可视化表达基本方法的学习,学生掌握了 利用恰当的软件工具或平台来处理数据,完成分析报告;该学习过程将知识建构、技能培养与思维发展融入到 运用数字化工具解决问题和完成任务的过程中,促进信息技术学科核心素养达成,完成项目学习目标。
附件 2:项目学习活动记录表
第五章项目学习活动记录表
班级
小组编号
项 目 选 题 项目主题
项目城市
小组成员及分工
组长:
记录员:
项 目 规 划 问题列表
编号 问题内容 方法
活动 2:通过案例展示及相互交流,体会大数据对日常生活产生的影响。
知识技能
大数据对日常生 活的影响 正面影响 负面影响
探 究 活 动 项 目 实 施 活动 4:确定项目数据需求。通过学习和交流,了解数据采集的基本方法和常用工具, 根据选定的项目主题,确定项目的数据需求,列出数据采集清单和内容大纲,采集数 据使用的方法和工具,数据保存形式。
知识技能
编号 项目数据内容 数据来源 采集方法和工具
1
2
活动 5:采集数据。通过学习、交流、探究和实践,结合本小组选题,结合本小组选 题,了解 Python 第三方库的安装,体验爬虫程序;指导学生安装后羿采集器,在线爬 取网络数据。
知识技能
语句 语句作用
import requests
from 模块名 import 方法名
结合小组选题,采集网络数据、数据文件与内容(截图):
活动 6:特征探索。通过学习、交流、探究和实践,结合本小组选题,对采集到的数据 进行预处理,发现和处理缺失值、处理异常数据、求最值、极差、组距,观察分析数 据的分布特征。
知识技能
数据预处理程序关键代码: #1、去除重复行 df=pd.read_csv(file,encoding='gb2312',header=0 ) #读取文件 可视化图形(截图):
data=df.drop_duplicates(keep='first') #去除 重复行 data.to_csv(savename,encoding='gb2312',index=F alse) #保存文件 #2、缺失值处理代码 for i in range(len(x)-1): #去除每一项数据 if math.isnan(x[i]) == True: #如果是空值 x[i] =round( (x[i-1]+x[i+1])/2,0) #替换数 据
特征探索结果分析: 程序运后文件夹中多了哪两个文件: 对比这两个文件中的数据与原始数据的区别是:
活动 7:平均值分析法。通过学习、交流、探究和实践,结合小组选题,对采集到的数 据进行平均分析。
知识技能
平均值分析程序关键代码: #逐年计算平均空气质量 data=[["年份","空气质量指数"]] #定义新表格列 标题 for year in years: #for 循环 avg_aqi=round(df.loc[year]["空气质量指数 "].mean(),0) #mean()函数逐年计算平均值 temp=[year,avg_aqi] #将年份、平均 AQI 的 值保存在列表 temp 中 可视化图形(截图):
data.append(temp) # 再将 temp 添加到列 表 data 中
平均值分析结果分析: 程序运后文件夹中多了哪一个文件: 通过这个文件内容说明空气质量发生什么变化:
活动 8:词云图。通过学习、交流、探究和实践,结合小组选题,以可视化的方式呈现 数据。
知识与技能
词云图程序关键代码: 打开文件,读取内容并进行分词操作 with open(filename,'r',encoding = 'utf-8') as f: text=f.read() seg_list=jieba.lcut(text) #利用 jieba.lcut 精确模式进行分词 操作 print('seg_list',seg_list) print('程序运行中,请稍等...') 词云图(截图):
词云图结果分析: 观察两份文件生成的词云图有什么区别,为什么。 区别,为什么:
活动 9:通过对案例的学习、交流与分析,探究数据之间的关联关系。
知识与技能
主题 数据分析类型 合适图表
活动 10:使用 Excel 软件,组合小组选题,以可视化的方式呈现数据。
主题 图表 提示规律
活动 11:使用 Python 编程实现数据的可视化表达
主题 图形 关键代码 提示规律
附件 3:作品评价量规
项目及分值 评分标准与分值 得分
自评 互评
作品选题 20 准确把握项目学习的意义和目的。 5
选题切合实际、符合科学。 5
选题有应用价值、创新价值。 5
选题适宜解决、可行性高。 5
规划与分析 15 准确分析设计的目的。 5
准确分析方案的需求。 5
准确描述方案的功能。 5
工具与方法 10 合理使用数字化工具及资源。 5
围绕项目进行自主、协作学习。 5
步骤与过程 40 明确问题,了解利用 Python 程序语言和第三方库解决问题。 10
利用爬虫程序爬取网络数据 10
利用 Python 程序进行数据分析(包括特征探索、关联分析、 聚类分析、数据分类) 10
利用 Python 程序进行数据可视化表达 10
成果与报告 15 根据目的,设计出切实可行的方案。 5
正确评估数据分析和可视化表达的科学性、有效性及其所带来 的价值,能综合运用 Python 程序解决问题。 5
报告内容完整,结构清晰,排版美观。 5
合计得分 100

展开更多......

收起↑

资源预览