资源简介 (共22张PPT)5.2.1 数据采集的方法和工具(1)粤教版普通高中教科书信息技术 必修15.2 数据的采集第1课时知识回顾处理数据的一般过程:数据分析数据可视化表达数据采集数据采集的方法与工具数据的存储与保护导入数据采集数据采集的方法和工具12目录数据采集:根据需求采用适当的方法和工具获取数据。如:将文字录入电脑——键盘打字、扫描仪扫描记录课堂活动——照相机拍照、摄像机摄像等记录一段声音——麦克风录音1问:什么是数据的采集1 数据采集2 数据采集的方法和工具2问:数据采集的过程是怎样的?需要获取什么数据?温度怎么获取?测温仪/体温计为什么能够获取?温度传感器/液体金属热胀冷缩如何记录获取到的数据?填纸质表、问卷星登记等以记录全班同学当前的体温为例2 数据采集的方法和工具1 数据采集明确数据应用项目的需求采用适当的方法和工具数据的存储和保护围绕选定的项目主题,制定数据采集的需求清单和内容大纲针对不同的数据类型,选择适当的工具和方法,采集数据要选择合适的存储方式并注意数据安全数据采集的过程1 数据采集2 数据采集的方法和工具1 数据采集2 数据采集的方法和工具0103系统日志采集法网络数据采集法其他数据采集法02数据采集的基本方法:01系统日志采集法1 数据采集2 数据采集的方法和工具认知01系统日志采集法1 数据采集2 数据采集的方法和工具认知在信息系统中,系统日志是记录系统中硬件、软件和系统问题的信息文件。包括操作系统日志、应用程序日志、安全日志。01系统日志采集法1 数据采集2 数据采集的方法和工具认知体验活动一:参照微课《系统日志采集法》进行实践,在活动记录表中截图粘贴并分析你的计算机的情况截图:分析:02网络数据采集法1 数据采集2 数据采集的方法和工具认知内涵:指通过网络爬虫或网站公开API(应用程序接口)等方式从网站上获取数据信息。活动二:请观看视频:《网络爬虫是什么》思考如下问题:1.什么是网络爬虫?2.网络爬虫的应用有哪些?3.网络爬虫获取数据的流程是怎样的?4.如何实现爬虫程序爬取数据02网络数据采集法1 数据采集2 数据采集的方法和工具认知网络爬虫是什么?02网络数据采集法1 数据采集2 数据采集的方法和工具认知1.什么是网络爬虫?网络爬虫:又称网络蜘蛛、网络蚂蚁、网络机器人等。按照人们事先制定的爬取规则,可以代替人们自动地在互联网中进行数据的采集与整理。即:可以自动采集网络数据的程序02网络数据采集法1 数据采集2 数据采集的方法和工具认知2.网络爬虫的应用有哪些?02网络数据采集法1 数据采集2 数据采集的方法和工具认知3.网络爬虫获取数据的流程是怎样的?02网络数据采集法1 数据采集2 数据采集的方法和工具认知3.网络爬虫获取数据的流程是怎样的?获取网页的URL爬取网页的内容分析网页的内容提取有用的数据获取其他的URL,重复前面的步骤,直到满足停止条件注意:网络爬虫的合法性若采集的数据是个人使用,不违法若采集的数据使用时涉及商业盈利范畴,可能违法02网络数据采集法1 数据采集2 数据采集的方法和工具认知4.如何实现爬虫程序爬取数据使用Python语言的第三方库来实现爬虫编写使用到的库:requests库——获取网页信息bs4库(beautifulsoup)——解析HTML页面xlwt库——调用Excel模块,将获取的有用信息写入表格文件保存NumPy库 ——构建科学计算最基础的软件库Pandas ——主要用于快速简单的数据操作、聚合和可视化呈现Matplotlib ——Python绘图库02网络数据采集法1 数据采集2 数据采集的方法和工具活动三:结合微课《python第三方库的安装与使用》初步体验网络数据采集法:1、安装Python扩展库:通过pip安装requests库2、运行以下代码,简单体验使用爬虫程序采集网页数据。1)import requests(说明:导入爬去网页第三方库requests)2)r=requests.get(“http://www.”)(说明:获取网页地址URL,可尝试其他网址)3)r.status_code(显示连接状态)4)r.text(显示网页内容)5)r.apparent_encoding(显示内容编码)6)r.encoding="utf-8"(修改网页内容编码为utf-8编码)7)r.text(再次显示网页内容)体验1认知02网络数据采集法1 数据采集2 数据采集的方法和工具认知活动四:各小组结合前三个活动,交流与完善活动记录表体验交流总结THANK YOU 展开更多...... 收起↑ 资源预览