资源简介 第五章 数据处理与可视化表达课时教学设计第2课时 5.2.1 数据采集的方法和工具一、项目简介1、单元项目主题 网络购物平台客户行为数据分析和可视化表达2、单元项目情境 同学们,你网购过吗?在你的周围,会经常遇到网购行为吗?为什么会选择网购? 网络购物中,消费者购物的任何行为细节都会被服务器所记录。通过大数据分析,商家可以了解消费者的偏好甚至预测其购买行为,如图5-1所示。 大数据分析使得商家可以追踪客户的行为并确定最有效的方式以提升客户对购物平台的忠诚度,根据客户的个性化需求提供相应的产品或服务以获得更大的市场占有率。3、子项目二 网购数据的采集与存储二、课时内容分析1、主要内容1)数据采集的内涵与过程2)数据采集的基本方法2、内容要求通过典型的应用实例,了解数据采集的基本方法3、地位和作用本节是教科书的第五章第二节的第一小节,将带领学生了解数据采集方面的知识,尤其是利用计算机程序采集大数据的方法,是本章的一个难点,也是后续学习的知识基础和技能准备。三、课时目标分析1、核心素养目标信息意识 在日常生活中,根据实际解决问题的需要,恰当选择数字化工具,具备信息安全意识; 针对特定的信息问题,自觉、主动比较不同的信息源,能描述数据与信息的关系,确定合适的信息获取策略; 依据特定任务需求,甄别不同信息获取方法的优劣,并能利用适当途径甄别信息。 知识目标计算思维 按照问题解决方案,选用适当的数字化工具或方法获取组织分析数据,并能迁移到其他相关问题的解决过程中。 能力目标数字化学习与创新 针对特定的学习任务,运用一定的数字化学习策略管理学习过程与资源,完成任务,创作作品。在网络学习空间中开展协作学习,建构知识。信息社会责任 在信息活动中,具有信息安全意识,尊重和保护个人及他人的隐私。 在信息交流或合作中,尊重不同的信息文化,积极、主动地融入信息社会中。 情感目标2、项目目标本课时围绕“网络购物平台客户行为数据分析和可视化表达”项目,进入“子项目二:网购数据的采集与存储”,围绕项目问题组织学生进行自主、协作、探究程序设计语言的基础知识,从而将知识建构、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程中,完成阶段性项目学习目标。3、学业目标(1)能够明确数据应用项目的需求,能制定数据采集的需求清单;(2)能够了解数据采集的方法和工具四、课时教学重难点分析1、教学重点(1)理解数据采集的内涵与过程;(2)认识常见的数据采集方法,如系统日志采集法网络数据采集法等;(3)学会Python中第三方库的安装与使用。2、教学难点工具具体任务需求,采用有效的数据采集方法,并有效采集数据。五、学情分析1、知识积累 日常生活中学生对数据的采集有一定的认识,通过第三章,学生认识到利用计算机解决问题的方式及其高效性,通过第四章的学习,学生掌握了一定的Python编程基础,将有利于本课时的学习2、学习能力 1、高中生有一定的计算机操作能力,在第三章和第四章积累了一定的编程能力; 2、高中生自主、探究与协作能力也在前期的实践中有所提高; 3、高中生逻辑思维能力较强,便于本课时知识点理解。3、学习兴趣 学生对于利于计算机高效采集数据是比较感兴趣的。但是利用计算机程序采集数据需要一定的耐心和思考,因此学生的兴趣需要好的方式去维持。总结 需要结合贴合知识、贴近学生生活、难度适宜的项目问题逐步引导学生开展协作探究的知识学习,需要教师理清知识学习路线,整合项目思路,引导学生逐步掌握知识与技能,维持兴趣。六、教学方法与策略1、教学方法讲授演示法、任务驱动、协作讨论2、基本策略项目引导→任务驱动→练习巩固七、教学准备1、环境准备Python环境2、资源准备类型 项目 来源课件 5.2.1数据采集的方法和工具 教师制作活动文档 活动记录表知识问卷课时学习评价表工具 后羿采集器 网络下载微课 python第三方库的安装与使用 教师制作系统日志采集法.mp4 后羿采集器的使用.mp4网络爬虫.mp4 网络下载八、教学过程环节 教学活动 设计意图 目标达成环节一:复习回顾与课时主题导入 教师: 结合思维导图引导学生回顾5.1 认识大数据的相关内容 2、结合大单元项目梳理并导入本课时探究主题: 导入情境,明确学习方向 信息意识 、 信息社会责任环节二:知识一--数据采集的内涵与过程 教师: 围绕情境提出问题:如何采集数据?数据采集的方式有哪些? 结合实例解说数据采集的内涵和过程: 学生: 结合身边的实例理解学习内容。 理解数据采集方法共有的内容 计算思维环节三:知识二--系统日志采集法+探究活动一 教师: 1、指出数据采集的基本方法包括系统日志采集法、网络采集法和其他采集法。 2、提出问题:系统日志是什么?有什么作用?如何采集? 3、引导学生观看微课“系统日志采集法”和回答以上问题。 学生: 观看微课《系统日志采集法》,回答问题。 教师: 简单解说问题: 在信息系统中,系统日志是记录系统中硬件、软件和系统问题的信息文件。 通常是在目标主机上安装一个小程序,将目标主机的文本、应用程序、数据库等日志信息有选择地定向推送到日志服务器进行存储、监控和管理。 通过日志服务器可以监视系统中发生的事件,可以检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹。 学生: 探究活动一:小组协作,参照微课《系统日志采集法》进行实践,在探究活动记录表中截图粘贴并分析你的计算机的情况。 知识学习与实践操作逐步展开,促进知识学习与素养达成 计算思维 、数字化学习与创新环节四:知识三--网络数据采集法+探究活动二+探究活动三 教师: 简单介绍网络数据采集法:通过网络爬虫或网站公开的API(应用程序接口)等方式从网站上获取数据信息。该方法可将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并以结构化的方式存储。 提出问题:网络爬虫是什么?网络爬虫的应用有哪些?网络爬虫获取数据的流程是怎样的?如何实现爬虫程序爬取数据? 引导学生观看微课“网络爬虫.mp4”及思考和回答问题。 学生: 结合微课和活动记录表回答问题。 教师: 1、解说相关问题: 1)什么是网络爬虫? 网络爬虫:又称网络蜘蛛、网络蚂蚁、网络机器人等。按照人们事先制定的爬取规则,可以代替人们自动地在互联网中进行数据的采集与整理。即:可以自动采集网络数据的程序。 2)网络爬虫的应用有哪些? 网络爬虫获取数据的流程是怎样的? ①获取网页的URL ②爬取网页的内容 ③分析网页的内容 ④提取有用的数据 ⑤获取其他的URL,重复前面的步骤,直到满足停止条件 注意:网络爬虫的合法性 4)如何实现爬虫程序爬取数据? 使用Python语言的第三方库来实现爬虫编写: 常使用到的库: requests库——获取网页信息 bs4库(beautifulsoup)——解析HTML页面 xlwt库——调用Excel模块,将获取的有用信息写入表格文件保存 NumPy库 ——构建科学计算最基础的软件库 Pandas ——主要用于快速简单的数据操作、聚合和可视化呈现 Matplotlib ——Python绘图库 使用前需要用pip命令安装第三方库: 在Python中使用import语句导入指定模块的语法: 如课本P106 运用Python第三方库绘制正弦函数图像 操作演示Python第三方库的使用。 学生: 探究活动二:小组协作,结合微课《python第三方库的安装与使用》初步体验网络数据采集法: 1、安装Python扩展库:通过pip安装requests库 2、运行以下代码,简单体验使用爬虫程序采集网页数据。 1)import requests(说明:导入爬去网页第三方库requests) 2)r=requests.get(“http://www.”)(说明:获取网页地址URL,可尝试其他网址) 3)r.status_code(显示连接状态) 4)r.text(显示网页内容) 5)r.apparent_encoding(显示内容编码) 6)r.encoding="utf-8"(修改网页内容编码为utf-8编码) 7)r.text(再次显示网页内容) 探究活动三:小组协作,结合微课《后羿采集器的使用》体验爬虫程序采集采集淘宝“进口零食”数据的过程,并展示成果。 教师: 分析学生探究活动一和探究活动二的成果。 知识学习与实践操作逐步展开,促进知识学习与素养达成 计算思维 、数字化学习与创新、信息社会责任环节五:其他数据采集法 教师: 结合实例简单分析其他的数据采集方法。 对于企业生产经营或科学研究等保密性要求较高的数据,可通过与企业或研究机构合作,使用特定系统接口等相关方式收集数据。 例如,科学研究的数据是通过科学实验的各种传感器采集,并传输到数据库管理系统中的。 拓展认识 信息社会 责任 、信息意识环节五:知识巩固 教师: 引导学生完成本课时展示问卷: https://ks.wjx.top/vm/PLCD7lK.aspx# 促进知识的检测与巩固 数字化学习与创新环节六:总结 教师: 引导学生建立本课时知识的思维导图: 梳理知识 数字化学习与创新九、教学板书规划板书基本知识主题+疑难点知识分析十、教学反思十一、附件单:编号 项目 作用附件一 课时活动记录表 追踪与评价学生学习过程,积累过程资料附件二 阶段学习评价量规 评价过程学习,促进学习与教学改进附件一:课时活动记录表第五章第2课时5.2.1 数据采集的方法和工具项目学习活动记录表班级 组长 你的姓名学习目标 1、认识数据采集的采用方法 2、学会基本的数据采集方法的使用:如系统日志采集法、网络数据采集法中的简单的网络爬虫程序采集数据。学习活动 探究活动一:小组协作,参照微课《系统日志采集法》进行实践,在探究活动记录表中截图粘贴并分析你的计算机的情况。 截图:分析:探究活动二:小组协作,结合微课《python第三方库的安装与使用》初步体验网络数据采集法: 1、安装Python扩展库:通过pip安装requests库 2、运行以下代码,简单体验使用爬虫程序采集网页数据。 1)import requests(说明:导入爬去网页第三方库requests) 2)r=requests.get(“http://www.”)(说明:获取网页地址URL,可尝试其他网址) 3)r.status_code(显示连接状态) 4)r.text(显示网页内容) 5)r.apparent_encoding(显示内容编码) 6)r.encoding="utf-8"(修改网页内容编码为utf-8编码) 7)r.text(再次显示网页内容)探究活动三:小组协作,结合微课《后羿采集器的使用》体验爬虫程序采集采集淘宝“进口零食”数据的过程,并展示成果。检测 完成本课时展示问卷: https://ks.wjx.top/vm/PLCD7lK.aspx#附件二:阶段学习评价量规项目及分值 评分标准 分值 得分自评 互评 师评知识掌握 50 理解数据采集的内涵; 10认识数据采集的常用方法; 10理解系统日志采集法的作用; 10理解网络采集法的内涵和网络爬虫的作用; 10理解Python第三方库的使用方法; 10操作技能 30 掌握系统日志采集法 10掌握Python第三方库的使用 10学会用简单的爬虫程序采集数据 10项目学习 20 明确项目探究的意义 10在活动中能够与同伴协作完成任务,分享成果 10合计得分 100 展开更多...... 收起↑ 资源预览