资源简介 第二章 信息的来源与获取 2.3 网上资源检索 因特网上的网页数量每天以惊人的速度在增加,如何在因特网上快速地找到有用的网页,而不是盲目乱找,是每一位网络应用者必须解决的一个问题。 1、如何获知未知的网站地址? 2、如何知道某个网站中的特定信息? 3、如何方便地获得有关某一主题的所有信息? 这些问题都可以通过网上资源检索的方式来解决。 如何在因特网上检索资源? 常用的几种途径分别是通过搜索引擎、主题目录和元搜索引擎来检索信息。 1、搜索引擎 搜索引擎是一种在因特网上用于查询万维网、新闻组、Gopher和FTP文档中文件与文档中关键字的应用程序库。 搜索引擎的核心技术: ①自动网页搜索技术 ②全文检索技术 自动网页搜索技术的基本工作分为以下四个方面: 1.搜索引擎首先运用自动网页搜索技术,即派出蜘蛛、机器人、爬虫、漫游者等网页搜索工具到因特网上各个网站搜索新的网站和网页,并把搜索结果的信息返回给搜索引擎。 2.搜索引擎的索引编辑程序编辑信息,建立分类索引,对索引数据库进行维护。(包括添加、修改、删除等) 3.根据用户提供的关键词或词组进行检索,找出匹配的索引条目。 4.通过网络返回基于浏览器界面的、经过排序的信息检索结果。 2.3.1 搜索引擎 全文检索是一种从全文中检索所需信息的检索技术,文本中的任何字符和字符串都可以作为检索入口点的检索方式。 全文检索的基本工作方式就是能够把所有包含检索词的文档检索出来。 全文检索技术的应用可以提高信息检索的查找速度、查全率和查准率,现在几乎所有的搜索引擎都使用了全文搜索技术。 2.3.1 搜索引擎 一、主要的搜索引擎有: 1.百度: www.baidu.com 2.谷歌: www.google.cn 3.搜搜: http://www.soso.com/ 二、利用搜索引擎提高搜索效率的一般方法 ①关键词的选择: 当某个与主题相关的关键词搜索不到理想的信息时,考虑更改为其他与主题相关的关键词进行搜索。 ②运用逻辑运算符 为了准确地缩小搜索的范围,可以用逻辑运算符把主题相关的几个关键词连接起来搜索。如,可以用“and 、or、not”或是符号“+、|、-”来分别表示“与”、“或”、“非”。 ③自然语言搜索 输入直接要问的问题或整个句子,搜索引擎会从中选出它认定的关键词,然后根据这些词进行搜索。例如:“姚明的身高是多少?” ④短语搜索 在百度这些搜索引擎中,可以通过添加英文双引号来实现短语搜索。给短语添加双引号,就是向搜索引擎指示,所找的信息必须完全符合双引号中的短语,包括文字的书写、数量、顺序都必须符合。例如:《柳堡的故事》 “滕王阁”是我国古代四大名楼之一,那么,其他三大名楼又是什么呢?它们分别在中国的什么地方呢?利用搜索引擎搜索答案,完成作业1。 2.3.2主题目录 万维网上所使用的一种分层次排列的主题类索引,多数主题被划分为若干子类或子目录。 特征:以超文本链接的方式将各种信息按分类目录的方式组织起来,类目之间按照层次逐级细分排列,主题目录的最底层由指向特定万维网网站或网页的超链接组成。 网上常见的主题目录网站: 搜狐网站:http://www.sohu.com 新浪网站:http://www.sina.com.cn 腾讯网站: http://www.qq.com/ 2.3.2主题目录 2.3.2主题目录 通过主题目录的方法查找信息比较方便,但存在查找范围窄,相关内容少,效率低下以及很难检索到较为专业的信息等问题。 主要优点: 所收录的资源经过人工组织,可以保证质量,减少了检索中的“噪声”,从而提高检索准确性 局限性: 花费大量的人力和时间,难以跟上网络信息的迅速发展,所涉及信息的范围有限,其数据库的规模也相对较小 主题目录适宜于一般性的、比较笼统的主题浏览和检索。 搜索引擎通过关键字可以直接得到需要的网页信息。 主题目录则是通过用户不断地逐层选择目录从而查找到相关网页信息。 2.3.2元搜索引擎 它是将用户的检索词同时送到数个搜索引擎,在它们的索引数据库中进行检索,对从这些搜索引擎数据库中找到的相关记录集合进行一些必要的处理,最后向用户提交一个统一界面的搜索结果。 那么元搜索引擎的主要价值是什么呢? 一般搜索引擎的搜索范围仅局限于其自身的索引数据库,即使当今世界上最大的搜索引擎的索引数据库也只覆盖了不到50%的网页;同时,由于不同的搜索引擎各自的技术不同,对同一检索要求的搜索结果也可能很不相同,要想得到比较全面的网上信息索引,就要使用多个搜索引擎进行查找,比较费时费力。 针对这些问题,元搜索引擎自动将检索信息送到多个引擎,并进行整合,可以帮助用户快速得到更全面的信息。 主要元搜索引擎网站 www.search.com 第二章 信息的来源与获取 2.4 因特网信息资源评价 案例分析 “恭喜,您已被温馨系统随机选中,成为了当日的幸运大玩家,请与我们的后台系统联系。”正在打开网络游戏———劲乐团的网络游戏玩家张小姐看见突然弹出了这么一个对话框,心里纳闷,点击进入网页一看,网页系统提示张小姐中奖了,奖品是奖金8808元外加价值13000元的索尼笔记本电脑一部。但经确认后,系统又出现提示,领取奖品前要先汇手续费380元。 在奖品的诱惑下,张小姐在半信半疑中汇出了380元,连等了几天,没有回音。张小姐着急了,打电话到网络游戏公司去询问,工作人员却告诉她,公司并没有举办过类似的活动。 因特网上储存了海量信息,这为获取信息提供了极大的便利。同时,因特网上也存在着大量难辨真伪的“灰色信息”,信息的膨胀和无须导致的“信息超载”也困扰着人们。怎样解决这些问题呢? “去伪存真” 一、常用的三种主要方式来评价因特网信息资源: 统计评价(可信度高) 如点击率 专家或核心刊物评价(专业性强,有较高的参考价值) 个人推荐(参考价值相对较低) 如热门网站精选、网站精选 2.4因特网信息资源评价 二、因特网信息资源评价的基本内容: 评价信息资源时,应考虑以下几方面: (1)信息质量; 评价信息资源最重要、最基本的标准。包括学术水平、可信度、时效性、内容的连续性等方面。 (2)范围; 信息的广度和深度。 (3)易用性; 使用网上信息资源所需要的基本条件。 (4)稳定性和连续性。 稳定和连续的信息资源可以为用户提供及时的信息服务。另一方面,可显示这些网站较为专业和敬业。 三、因特网信息资源评价的基本内容: 常常采用CARS列表的评价方法 CARS列表评价方式 1、可信度(credibility) 信息资源的提供者是否可信 信息资源的质量是否有保证——资源是否经过严格审核 2、准确度(accuracy) 信息资源的准确度主要与“真实性”、“时效性”、“全面性”、“适切性”等要素有关。 3、合理性(reasonable) 公平、客观、适度、一致的信息资源,才是真正合理的资源。 4、相关支持(support) 信息出处的判断 相关资料的确证 外部一致性的核查 展开更多...... 收起↑ 资源预览