资源简介 (共25张PPT)网页的数据组织DESIGN TEAM WORK REPORT4网页数据的检索3超链接HTML语言2HTML标签1目录HTML语言1HTML语言浏览网站时,人们能欣赏到组织有序且包含着丰富的文字、图片、声音、视频等内容的网页,这些都是通过HTML语言来设计、组织的。一、HTLM语言HTML (HyperText Marked Language)即超文本标记语言,定义了网页内容的结构和内容。用HTML编写的超文本文件称为HTML文件,HTML文件一般通过浏览器解释执行。在使用浏览器访问网页时,浏览器读取并分析HTML文件中的代码,根据解释的结果呈现网页内容。HTML文件可以使用文本编辑器编写,也可以使用专业软件编辑。网页可以通过浏览器的“开发人员工具”看到HTML代码并编辑调试,如图7-1所示。HTML代码类型-文本数据网页标题:网页的标题,通常显示在浏览器的标题栏中正文内容:网页的主要内容,包括文本、图片、视频等超链接:链接到其他网页或资源的文本导航栏:用于导航的文本,如菜单、面包屑等搜索框:用于搜索网页内容的文本框广告文本:网页中的广告文本,如横幅广告、文本链接广告等321456图像数据图像类型:JPEG、PNG、GIF等01图像来源:相机、扫描仪、网络等02图像格式:RGB、CMYK、HSL等03图像压缩:有损压缩、无损压缩等04音频数据音频格式:常见的音频格式有MP3、WAV、AAC等音频编码:音频数据通常需要进行编码压缩,以减少存储空间和传输时间音频质量:音频数据的质量与编码方式、比特率等因素有关音频处理:音频数据可以进行剪辑、混音、降噪等处理01020304视频数据视频格式:常见的视频格式有MP4、AVI、MOV等视频编码:常见的视频编码有H视频分辨率:常见的视频分辨率有720P、1080P、4K等视频比特率:视频比特率决定了视频的清晰度和文件大小,常见的比特率有1Mbps、2Mbps、5Mbps等01020304HTLM标识2HTML结构HTML(超文本标记语言)是一种用于创建网页的标准标记语言。HTML文档由一系列成对的标签组成,这些标签用于定义网页的内容和结构。HTML文档的基本结构包括:- ``:声明文档类型为HTML5。- ``:根元素,包含整个HTML文档的内容。- ``:包含文档的元数据,如标题、描述和关键词等。- ``:包含文档的主体内容,如文本、图片、链接和表单等。HTML标签可以分为块级元素(如``、``)和行内元素(如``、``),它们具有不同的显示特性和布局方式。HTML标识HTML用标签来规定元素的属性和其在文件中的位置,一个HTML文件一般包含多个标签,HTML标签由“<”和“>”符号包围的字符串而组成,通常以成对标签出现。HTML文件的基本结构: #标记网页的开始# #标记头部的开始#显示网页的标题 #标记头部的结束# #标记网页的开始# #标记头部的开始# #标记网页正文开始#网页内容 #标记网页正文结束# #标记网页的结束#HTML标识网页首页index.html的代码及效果图,如图7-2所示。图7-2 首页的HTML代码HTML标识补充为了使网页便于用户浏览,可以使用HTML标签简单设置文本版面。居中对齐: 网页背景色:$ /body>字体格式:文字CSS样式CSS(Cascading Style Sheets)是一种用于描述网页样式的语言CSS样式表可以嵌套在HTML文件中,也可以单独存在CSS样式表可以定义网页元素的颜色、字体、位置等样式CSS样式表可以简化HTML代码,提高网页的可读性和可维护性网页超链接3超文本链接超文本链接(Hypertext Link)简称为超链接,可以实现从一个页面跳转到另一个页面或者跳转到页面的其他位置,实现文档互联、网站互联。在HTML文档中,链接无素可以是文本、图片等,建立超链接的标签为,href属性的作用是设置链接的位置,是标签必不可少的。常见格式如下:链接元素 a>如图7-3所示,代码第6行分别在链接元素“去百度”建立了超链接,点击“去百度”可打开相应的超链接文档。超文本链接图7-3 设置超链接的示例网页插入超链接的方法选中需要插入超链接的文本或对象点击鼠标右键,选择“超链接”在弹出的“超链接”对话框中,输入网址或选择已存在的文件点击“确定”,完成超链接的插入01030204删除超链接选择要删除的超链接文本或图片如果超链接文本或图片被其他元素覆盖、包围或嵌套,需要先选中覆盖、包围或嵌套的元素,然后按下键盘上的Delete键如果超链接文本或图片被其他元素嵌套,需要先选中嵌套的元素,然后按下键盘上的Delete键如果超链接文本或图片被其他元素覆盖,需要先选中被覆盖的元素,然后按下键盘上的Delete键按下键盘上的Delete键如果超链接文本或图片被其他元素包围,需要先选中包围的元素,然后按下键盘上的Delete键网页数据的检索4搜索引擎工作原理爬虫:搜索引擎通过爬虫程序抓取网页信息索引:将抓取到的网页信息进行索引,建立索引库查询:用户输入关键词进行查询,搜索引擎根据索引库进行匹配排序:根据一定的算法对搜索结果进行排序,将最相关的结果排在最前面网页排名算法PageRank算法:根据网页之间的链接关系计算网页的重要性HITS算法:根据网页的链接结构和内容质量计算网页的重要性TF-IDF算法:根据网页的内容和关键词计算网页的重要性SALSA算法:根据网页的链接结构和内容质量计算网页的重要性用户搜索体验03搜索界面:简洁明了,易于操作02搜索结果:准确匹配,提高搜索效率01搜索速度:快速响应,减少等待时间04搜索建议:提供相关搜索建议,帮助用户找到所需信息谢谢 展开更多...... 收起↑ 资源预览