第14课 互联网搜索新发展 课件(18张PPT)

资源下载
  1. 二一教育资源

第14课 互联网搜索新发展 课件(18张PPT)

资源简介

(共18张PPT)
第14课 互联网搜索新发展
第三单元 便捷的互联网服务
第14课 学习目标
1
2
3
了解搜索引擎的工作原理。
学习目标
知道搜索引擎的简单工作过程。
了解网络爬虫等自动化技术给搜索带来的影响。
第14课 课堂导入
学校读书节活动正在如火如荼地开展着,有些同学想通过网络了解更多图书的信息,有些同学想查找资料制作读书海报。如何在网络中简单、高效地寻找想要的信息呢?
问题情境
相信大家会不约而同地选择搜索引擎。下面,就带领同学们深入了解搜索引擎。
第14课 学习内容
二 搜索系统的创新改进
学习内容
一 搜索引擎的工作思路
一、搜索引擎的工作思路
第14课 学习内容
想象一下,互联网上有难以计数的网站,搜索引擎需要从这些网站中寻找与关键词相匹配的网页,然后返回搜索结果,应该需要花费很长时间。但实际上,在搜索引擎中输入问题或关键词后,很快就能看到结果,为什么能搜得这么快?
第14课 学习内容
实验目的 熟悉搜索引擎的工作过程
实验条件 《简易搜索系统》软件、配套资源中的Web文件夹
实验步骤
1.运行《简易搜索系统》软件,启动搜索服务,然后尝试用关键词“中国探月”进行搜索,查看搜索结果。
□搜到相关信息 □未搜到相关信息

一、搜索引擎的工作思路
第14课 学习内容
2.把老师提供的Web文件夹复制到搜索服务软件所在的文件夹中。
3.重新运行搜索服务软件后,再次以“中国探月”为关键词进行搜索。
一、搜索引擎的工作思路
第14课 学习内容
6.继续进行搜索,看看能否搜到刚刚保存的内容。
4.浏览一些网页,并把网页保存到Web文件夹中。
5.打开Web文件夹中的pages.csv,记录网页文件的文件名和对应的网址。
一、搜索引擎的工作思路
实验结论
1.搜索引擎搜到的信息是( □搜索前放进去的 □实时在网络中获取的)。
2.网页数据都保存在:
3.网页文件跟实际网址的关系保存在:
4.当前网页排序用的算法是:
第14课 学习内容

Web文件夹
pages.csv
根据关键词出现的次数进行排序,次数越多越靠前
一、搜索引擎的工作思路
第14课 学习内容
5.梳理搜索系统的结构组成,把下图补充完整。
A.网页数据
B.建立索引
C.网页索引
D.获取信息
E.网页排序
D
A
B
C
E
一、搜索引擎的工作思路
第14课 学习内容
搜索引擎提前把海量信息保存下来,耗费了大量的存储空间,换来了对查询需求的快速响应。这种工作方式体现了“以空间换时间”的思想。
一、搜索引擎的工作思路
第14课 学习内容
如果让计算机替代人工操作,会极大提升工作效率。例如,用网络爬虫自动获取相关的网页以备查询。
通过人工操作来扩充搜索系统中的网页数据比较烦琐,有没有办法更高效地完成相关操作呢?
二、搜索系统的创新改进
第14课 学习内容
1.运行《网络爬虫测试》软件,输入一个网址后,单击窗口中的按钮,看看能否自动获取相应的网页。
2.把spider.pyc文件复制到搜索系统文件夹中,然后重新运行《简易搜索系统》软件,观察界面的变化。
二、搜索系统的创新改进
第14课 学习内容
二、搜索系统的创新改进
3.输入一个网址,然后单击“启动网络爬虫”按钮。
4.尝试用相应的关键词搜索,对比一下搜索到的结果有什么不同。
第14课 学习内容
5.对照搜索引擎工作流程,梳理网络爬虫对搜索引擎的改进。
→自动
→自动
二、搜索系统的创新改进
1.搜索引擎提前把信息保存下来,以供用户搜索。
2.搜索引擎的工作流程包含获取信息、建立索引、网页排序等步骤。
3.搜索引擎通过自动爬取网页等技术提高效率。
第14课 课堂总结
1.运行《分词测试》软件,输入一个短语进行分词,感受分词的效果。
第14课 拓展与提升
2.把tokenizer.pyc文件复制到搜索系统文件夹中,然后运行《简易搜索系统》软件,看看搜索结果的变化。
进一步创新改进搜索系统
3.搜索结果是根据关键词出现的次数进行排序的。请思考:除了“关键词出现次数”这一指标外,还有哪些指标可以让搜到的网页,排序更精准?
第14课 拓展与提升
4.参照搜索引擎工作流程,畅想一下,还有什么地方可以改进,然后交流讨论技术创新的推动作用。
进一步创新改进搜索系统

展开更多......

收起↑

资源预览