小学中高年级课后服务 python编程教学 四阶第12课 数据提取之正则 课件 (26张PPT)

资源下载
  1. 二一教育资源

小学中高年级课后服务 python编程教学 四阶第12课 数据提取之正则 课件 (26张PPT)

资源简介

(共26张PPT)
空白演示
在此输入您的封面副标题

数据提取之
正则
目录
python
贪婪与非贪婪

"r"的作用
使用正则进行数据提取

贪婪与非贪婪
情景引入
源字符串:
aa

test1
bb
test2
cc
正则表达式一
.*

匹配结果一:
test1
bb
test2

正则表达式二:
.*

匹配结果二:
test1

循序善诱
源字符串:
aa
test1
bb
test2
cc
正则表达式一:
.*

匹配结果一:
test1
bb
test2

正则表达式一采用的是贪婪模式,在匹配到第一个“”时已经可以使整个表达式匹配
成功,但是由于采用的是贪婪模式,所以仍然要向右尝试匹配,查看是否还有更长的可以
成功匹配的子串,匹配到第二个””后,向右再没有可以成功匹配的子串,匹配结束,
匹配结果为"
test1
bb
test2
”。
循序善诱
源字符串:
aa
test1
bb
test2
cc
正则表达式二:
,*

匹配结果二:
test1

正则表达式二采用的是非贪婪模式,在匹配到第一个””时使整个表达式匹配成功,由
于采用的是非贪婪模式,所以结束匹配,不再向右尝试,匹配结果为”
test1
”。
思维构建
就是在整个表达式匹配成功的前提下,尽可能多的匹配,也
贪婪模式
就是所谓的"贪婪”
·通俗点讲,就是看到想要的,有多少就检多少,除非再也没
有想要的了。
在整个表达式匹配成功的前提下,尽可能少的匹配,也就是
非贪婪模式
所谓的"非贪婪”
·通俗点进,就是找到一个想要的捡起来就行了,至于还有没
有没捡的就不管了。
Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪)
编玩边学
通检热唐排序
○按动间排序
○按评价排序
口我设过的口可在找福放
思考:

面比尔和装德导
航5.5
团女人四十玩说地
飞别人牛5.3
无名之业8.1
Console Souces Elerre-ts
如何提取网页代码
wedlv class"grid-1e-a clearfix">
xdiy class-"article"
年d1yc1w55.1w9
c1yc1555-8etw11-po05ty1e-"disp1;gre5t0;352,125p%51ett:29,50i"/
ediv c1as6.“p1Iter-甲'-中电影图片的网址
div class-"fliter-ploceholder"
style-"helght:upx"xc/alw
81g{
1yc1555115t-p
ed时
7
wertic
a class-"Iter target-"_blank"heef-ttdban.c
81a1f红业n'>
81yc185
Bg「
链接
1形r
1e.
berder
werkid

4》-1g{
nax-ai
◆gcla55-"ite”target-”b1nk”ref-过8He边hnr边xt91831t51">/8
ca class."iten target."blank"fref.ttps://movie.couban.com/subject/24007218/tigF8fremgaia"x/ax
1e1052t
a class-"Iten target"_blank hrefnttoban.coolsubiestla1g4888/7t2g-fg1a videg">/
bcrder
c1s55"1te
ac1a55"1tetr8t"_b1 nk"href:L士bǘ.ǚ5t4-里3f1L1d"-a>
Inherited
class-"tter target-"_blank"href-ntts://mzyechan.con/si1est/528/3t-fgeegala videg">_/
811
iten:ac
a-wireewsua-wet:kit bocy drtcorte-l cigrid-16-8derfs tivartide dv.is-ap cis.is!autom divcovr-np

展开更多......

收起↑

资源预览