资源简介 5.2 数据处理的采集(第1课时)教学设计一、教材分析1. 本节对应课标的内容要求数据采集的基本方法和工具,数据存储的方法,数据的保护。2. 本节对应的学业要求了解数据采集的基本方法(计算思维)。并能通过技术方法对数据进行保护(计算思维、信息社会责任)。3. 本节的地位和作用本章《数据处理和可视化表达》以“网络购物平台客户行为数据分析和可视化表达”为项目范例,通过“网络购物平台商品销售数据分析和可视化表达”项目,让学生理解随着社会数据量和个人数据量的增大,选用恰当的软件工具或平台处理数据、发现信息,已逐步成为人们解决问题的一种重要方式;并通过对数据和大数据进行采集、存储、处理,以及从中发掘有价值的信息等过程,让学生全面了解数据与计算的重要意义,从而提升学生的信息素养。在“认识大数据——数据的采集——数据的分析——数据的可视化表达”这一过程中,数据的采集为数据的分析和可视化表达做准备。虽然本章“数据”是指向大数据,但是数据的采集,也包括常用数据,所以内容的选择上将数据的采集与数据的编码联系起来。二、学情分析学生在第四章已经体验了利用程序去解决问题。了解了python程序设计语言的基础知识,掌握了程序的顺序结构、选择结构和循环结构,学会了使用程序设计语言实现简单算法,体验了程序设计基本流程,掌握了程序调试与运行的方法。所以在教师的引导下,能够阅读并理解教材上的数据爬取范例,完成代码调试。教学目标知识与技能:了解数据采集的基本方法;过程与方法:了解数据采集的一般过程,能够明确数据应用项目的需求,能制定数据采集的需求清单;了解数据采集常用方法和工具,并能使用采集数据。情感态度价值观:1、能够理解对数据保护的意义。教学重难点重点:了解数据采集的方法和工具;难点:理解网络信息采集法中网络爬虫工作原理,阅读并调试爬虫程序。教学方法讲授法、范例教学法、任务驱动法、项目教学法教学环境及资源安装XAMPP、Python 3.10,搭建网络商城,百度网盘资源共享课堂微课资源、安装程序和学习表格。教学过程教学过程 教学内容 教师活动 学生活动 设计意图课堂引入 回顾数据常见类型及采集设备。 引入数据的采集 知识回顾: 常见的数据类型有哪些? 这数据类型用什么设备可以获取? 展示第一章与第五章知识结构图 引导分析数据采集的异同。 文本,图片,音频,视频等 键盘,数码相机,麦克风,数码DV等 观看两个电影中数据采集的场景。 将数据采集与第一章学习的数据编码联系起来,认识数据采集的范畴。 对数据采集有直观的认识。知识讲授 数据采集的定义 数据采集是利用一种装置,从系统外部采集数据并输入到系统内部的一个接口。(百度百科) 数据采集是指根据需求采用适当的方法和工具获取所需要的数据。(课本描述) 数据采集的定义任务驱动 数据采集体验——你知道自己的精确位置吗? 需要获取什么数据? 去哪儿找经纬度? 手机APP为什么能获取经纬度? 下载手机APP,获取经纬度,完成体验数据采集记录表。 思考:手机为什么能获取经纬度信息呢? 引入传感器数据采集法。知识讲授 数据采集的过程 讲授: 明确数据应用的需求:围绕项目主题,制定数据采集的需求清单和内容大纲。 选择适当的方法和工具:针对不同数据类型,选择适当的工具,运用有效的方法,进行数据采集。 数据的存储和保护:采集的数据要选择合适的存储方式并注意数据安全,为数据分析和可视化表达做准备。 思考:经纬度采集体验中,经纬度、手机APP及传感器对应数据采集的过程。 用合理的方法进行数据的采集课堂任务 淘宝购物平台上各种商品应有尽有,假如你在该平台开了一个零食网店,最近你要调整经营策略,以提高网店的盈利水平。 在调整经营策略之前你必须进行前期调研分析,比如通过分析淘宝网上各类零食的销量数据,去重新定位销售商品的种类和价格;通过分析网店销售数据订单,去了解客户的购物喜好,去判断哪些商品可以捆绑销售。从而下架一些销量不好商品和上架一些新的商品。 那么,你要完成前期调研工作,需要获取到哪些数据呢?完成下表中第2,3列。 确定项目的数据需求,完成数据采集过程记录表格: 分析和确定项目的数据内容需求、数据来源、采集方法和工具以及数据保存形式知识讲授 数据采集的方法 1、传感器采集法: 利用数据采集设备,检测、采集物理信息,并将其转换为电信号形式表示的一种采集方法。 2、系统日志采集法: 利用系统中记录硬件、软件和系统问题的信息文件来采集数据。 3、网络数据采集法: 通过网络爬虫或网站API(应用程序接口)等方式从网站上获取数据信息。 学习数据采集方法,重点了解网络爬虫。 补充了传感器采集发,对数据采集有全面的认识。程序实践 爬虫程序实践 步骤: 1、搭建“网络商城”网站:安装、并运行XAMPP,启动Apache、MySQL; 将文件“wholesale.html”复制到C:\xampp\htdocs目录下。 2、网站测试:浏览器输入http://127.0.0.1/ wholesale.html ,访问网站,尝试查看网页源码。 3、Python安装所用库:通过pip安装bs4、requests、xlwt、datetime等库。 4、运行Python IDLE调试:打开“程序5-3-2 爬取程序(教材范例).py”,阅读关键代码,调试运行。 BeautifulSoup库:编写 python 爬虫常用库 requests库:是网络请求库 关键代码: 1、resp = requests.get(url, params=payload) 2、soup = bs4.BeautifulSoup(resp.text, "html.parser") 3、all_title = soup.find_all('a', class_='item-title') 5、浏览抓取的数据:打开名如“nike*.xls”的excel文件。 通过学习、交流、探究和实践,借助学习资源,体验安装第三方库,体验搭建本地WEB服务器,运行爬虫程序采集本地服务器数据,修改爬虫程序代码采集网络数据。 体验爬虫程序,理解网络数据获取的方法。课堂小结 总结回顾附学习记录表:1、体验数据采集记录安装的APP名称我的经度我的纬度使用评价2、数据采集过程记录表编号 项目数据内容大纲 数据来源 采集方法和工具 数据保存形式1233、爬虫程序数据采集关键代码记录表语句 语句作用 展开更多...... 收起↑ 资源预览