小学中高年级课后服务 python编程教学 四阶第13课 数据提取之xpath (31张PPT)

资源下载
  1. 二一教育资源

小学中高年级课后服务 python编程教学 四阶第13课 数据提取之xpath (31张PPT)

资源简介

(共31张PPT)
空白演示
在此输入您的封面副标题

数据提取之
xpath
情景引入
掌握了正则表达式以及
jsonpath数据提取的方法之后
为什么要学习xpath呢?
循序善诱
jsonpathi提取的是浏览器数据交互时传输的json数据文件中的数据
←→lagoucom/lbs/getAKitySearchLabeks.son
应用参顶-下itay00uh鸟6g中帮强
4T0
"..
000
2
Ap
的0
0
08100
5制
ted
141.
循序善诱
←→C。move.doubsn2 omn/tap250
相迪用坐可发-下0 ineerbory门Gtub44c写=君n
LOa/心P4uw
口发药拉
当申克E软整,8SdWA3张Re物m0n月黑离u活/B19台)可量
正则表达式则是在网页源
导准井三克博拉特Fan作Daoa唯主囊常读罗斯m比s上
104/熊国2作情
★★★★女972174125人写
4让人白。特
码中去匹配出所需要的数
g目1cega
2大nnc Wenc Ap:kn:
据内容。
rtn2uuaa生d山ep,“afar'c/uurtgt
卡y进”e入H
tyae-"tet/sr
循序善诱
xpath是如何提取数据的呢?
它提取的又是什么样的数据?
今天,我们就来认识一种新的数据提取方法
目录
python
认识xpath与xml结构
线
ABE
xpath的节点关系
xpathi语法


认识xpath与xml结构
新知教授
XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档
中查找信息的语言。最初是用来搜寻XML文档的,但同样适用于HTML文档的搜索。
所以在做爬虫时完全可以使用XPth做相应的信息抽取。
新知教授
XML,可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有
结构性的标记语言。
数据
描述
设计目标
格式
Extensible Markup
XML
Language
(可扩展标
被设计为传输和存储数据,其焦点是数据的内容。
记语言)
HyperText Markup
HTML
Language
(超文本标
显示数据以及如何更好显示数据。
记语言)
思维构建
学生名单>
班级名称="计算机1班">
XML文档
学生姓名="张三”学号="001">
<籍贯>山东青岛/籍贯>
<爱好>足球,音乐/爱好
/学生)
班级>
XPath
/学生名单/班级/学生/籍贯
学生名单
计算机1班
文档结构
张三
山东青岛
足球,音乐

展开更多......

收起↑

资源预览