第3单元第4课《跨学科活动:玩转网络信息》教案【清华大学版】《信息科技》七年级下册

资源下载
  1. 二一教育资源

第3单元第4课《跨学科活动:玩转网络信息》教案【清华大学版】《信息科技》七年级下册

资源简介

中小学教育资源及组卷应用平台
第4课《跨学科活动:玩转网络信息》教学设计
课题 跨学科活动:玩转网络信息 单元 第三单元 学科 信息科技 年级 七年级下
核心素养目标 信息意识:了解网页数据分析的不同工具的需求,知道网页文本分析的规划实施过程,理解如何爬取与分析网络数据。计算思维:知道如何爬取网页中的文本,能够爬取和分析网络数据,学会处理原始文本数据,能够在线制作词云。数字化学习与创新:通过爬取文本和数据清理等方式,对文本数据进行分析、提取关键词,在学习过程中玩转网络,提升创新能力。信息社会责任:在制作词云时,应确保不侵犯他人的版权,尊重数据的隐私性,并在分享结果时注明数据来源,维护信息的真实性和可靠性。
教学重点 1、熟练掌握并运用爬取文本工具进行词云生成和制作。
教学难点 1、能够熟练轻松的掌握爬取文本等数据处理方式服务于现实生活。
教学过程
教学环节 教师活动 学生活动 设计意图
导入新课 板书课题。本课中你将体验: 如何爬取网页中的文本如何处理原始文本数据如何在线制作词云学校即将举办“网络诗词文本分析”大赛,要求参赛者对网络中的唐诗宋词等传统文学作品进行数据分析,以挖掘一些有趣的现象。比如,从文本中统计出现频率最高的特定字词,就可以了解古代文人对季节、颜色或饮食等方面的偏好。你想挖掘哪些有趣的现象 请组建一个小组,一起完成这个任务吧!2、观看教学视频。 学习新知引入,观看教学视频。 用提问的方式引入课题,增强课堂互动性。将学生的注意吸引到课堂。
讲授新课 新知讲解一、需求分析网络中的唐诗宋词文本,主要以网页或其他文本文件形式存在。因此先要确认网页的网址或下载相关的文本文件,再利用传统的爬虫工具来爬取网页文本或使用更为简单的人工智能大语言模型工具来自动获取相关的文本,并进行数据清洗、文本分词、词频统计与结果呈现等相关操作,进而挖掘出你想要的有趣现象。可以根据所在实验室的情况,自行选择如表3.4.1所示大语言模型工具或爬虫+中文词频分析工具进行挖掘分析。表 3.4.1 网页数据分析的工具需求与推荐二、分工合作为了更好地完成“网络诗词文本分析”项目,你的小组需要进行合作分工。小组成员的分工角色与合作职责,既可以参考表3.4.2的范例,也可以自行设计。姓名角色分工A组长主持整个项目开展过程,协调处理各种情况以确保完成项目任务B组织员组织各成员共同开展需求分析、规划实施与交流评价具体活动C记录员记录并整理需求分析、规划实施与交流评价等活动的相关信息D检查员核查各项任务的完成情况,制作汇报PPT 并对外展示交流三、规划实施网页文本分析的规划实施过程,可以分为确定对象、爬取文本、数据清洗、文本分词、词频统计、绘制词云图与撰写分析报告等环节。但由于分析对象与分析工具的不同,小组可能要根据实际情况来微调具体的实施环节。1.确定对象根据“网络诗词文本分析”大赛的规则,从网络中搜索并选出符合小组任务要求的相关网页或文本。它既可以是一张或多张包含唐诗宋词文本的网页,也可以是可下载的其他文本文件。小组所筛选的网页或准备下载文本文件的网址是:百度搜索2.爬取文本如果运用大语言模型工具进行文本爬取,可以通过如图 3.4.1所示的提示词来直接获取并进行统计分析。如果使用 EasySpider 爬取网页文本,则一般要经历创建新任务、选择内容元素、设置爬虫规则、保存任务信息、执行任务等步骤。它的操作界面如图 3.4.2 所示。请通过网络自行学习其操作规则,再用以爬取所筛选网页的文本。3.数据清理数据清洗是为了去除所爬取的原始文本中的无用内容或对分析结果有干扰的文本。无用内容如空格、换行符或其他特殊字符等;有干扰文本如大量的“之”“而”等,它们会导致后续的词频统计出现偏差。特别需要注意的是,如果对下载的文本文件进行统计分析,通常要事先对其进行数据清洗。文本数据清洗方法,主要有手动方式与使用工具两种。手动方式最简单,就是通过“搜索+替换”操作,来达到去除的目的。请根据所爬取文本的实际情况,清洗原始文本,并将相关记录填人表 3.4.3 中。待清洗词语或字符清洗理由清洗方法清洗效果“ ”影响文本正常显示和后续处理,属于多余特殊字符通过“搜索 + 替换”,将“ ”替换为空字符串文本中不再出现“ ”“--”在特定文本中可能造成语义混淆使用工具匹配“--”并替换为空格文本中“--”被替换为空格“【】”方括号内的内容可能是额外注释或不相关信息通过“搜索 + 替换”,将“【】”及其中内容全部删除文本中不再有方括号及其中内容“……”多余的省略号可能干扰文本分析使用文本编辑器的批量替换功能,将“……”替换为单个句号文本中多余的省略号被替换4.文本分词文本分词是利用分词工具,将清洗后的文本,按照一定的规则,自动地分割为一个个独立的词语。由于中文分词相对复杂,并且支持分词的工具众多,相同的文本可能会因为不同的分词规则而产生不同的结果。大语言模型工具会根据自身规则对文本进行分词,其生成结果不一定完全符合数据分析的要求,可能还需要小组通过人工方式进行修正。使用表 3.4.1 中的中文词频分析工具进行文本分词,只需将文本复制到表单中,再根据需要设置分词规则,最后提取结果。请对清洗后的文本进行文本分词,如图 3.4.3 所示。5.词频统计使用分词工具进行文本分词之后,会统计相同词语出现的次数,即词频。一个词语的词频越大,说明其影响力越强。分词工具可以提供所有词语的词频,但用户还要根据自身的数据挖掘需求,筛选相应词语的词频。比如,想要分析古代某位文人对颜色的偏好,那么就要从词频统计结果中筛选所有与颜色相关的词频。请根据你小组想要挖掘的有趣现象,来筛选相关词语的词频,并填写在表 3.4.4 中。表 3.4.4 词频统计筛选表序号筛选的词语出现的词频①“环保”23②“可持续发展”18③“绿色出行”15④“垃圾分类”19⑤“节能减排”286.绘制词云图词云图是一种将文本数据进行可视化的方法。简单地说,它是将选的词语绘制成图片,并根据词频的高低来设置不同的字体与颜色,以突出词语的重要程度,帮助浏览者快速把握文本的主旨。“中文词频分析”工具直接提供了绘制词云图的功能,运用方法如图 3.4.4 所示。大部分的大语言模型工具,虽然没有这方面的直接功能,但可以先让它帮你生成相应的 Python 程序代码,再通过运行程序代码方式来达到间接绘制的目的,生成方式如图 3.4.5 所示。请为筛选的词语绘制一张词云图。7.撰写分析报告一份简单的网页文本分析报告,通常包括分析的目标、策略、过程与结论等内容。分析目标,需要说明分析的对象与想要挖掘的有趣现象;分析策略,要介绍解决问题的方法、工具的选择与使用;分析过程,要汇报实施的基本过程与收集到的相关数据;得出结论,要基于相关统计信息,得出科学的结论。请以小组为单位,基于以上的分析,在线协同撰写一份分析报告。四、交流评价项目成果交流,分为成果整理与交流两个环节。成果整理,就是整理包括工具选择、数据清洗、词云制作和分析报告等相关成果,并制作汇报用的 PPT。项目成果评价,可基于表3.4.5 的评价量规进行(根据工具选用情况选择对应的项目成果),以对自己与他人项目成果进行客观评价,并记录评价结果。五、课堂练习完成PPT27页——29页课堂作业。六、拓展延伸1、数据爬取技术BeautifulSoup是Python中非常流行的网页解析库,能够快速从HTML文档中提取数据。Scrapy是一个功能强大的爬虫框架,适合进行大规模的爬取。Scrapy通过项目结构来组织爬虫,支持多线程下载和数据存储。2、自然语言处理NLTK是一个非常流行的自然语言处理库,适用于文本分析和处理。 spaCy是一个高效的自然语言处理库,专注于工业级应用,支持许多高级功能,如命名实体识别(NER)和依存解析。七、单元回顾与总结1、单元回顾。2、知识梳理。3、学习检测。4、反思评价。 完成词文爬取前期的需求分析。进行合理分工。完成具体的网页文本分析实施过程。学习如何运用语言模型工具爬取文本内容。学习如何清理数据并完成表格填空。进行文本分词。进行绘制词云。进行交流评价。完成课堂练习。进行课外知识拓展。完成单元回顾与总结。 引导学生明确问题,进行需求分析,让研究内容更有针对性。锻炼学生的学习能力和实际动手能力。完成分工配置,进行合理分工,保证团队合作的有序性和优化性。引导学生在老师的帮助下详尽学习如何使用爬取工具进行文本分析,培养学生的实践能力和项目实施有序性。将理论与实践相结合,提高学生对本课知识内容的理解。引导学习学习具体的数据清理方式,并完成填空,提高课题的互动性和强化学生的思考能力。逐步学习爬取文本的具体步骤。引导学生学会将文本数据进行可视化,方便更便利和直观的学习。在项目交流中互相学习,分享成果,强化学生对本课知识内容的掌握。在课堂练习中强化所学知识内容。拓宽学生知识面。再一次回顾本单元所学内容,强化本单元知识点。
课堂小结 跨学科活动:玩转网络信息1、进行新知引入2、进行需求分析和分工合作3、完成规划实施和评价交流4、完成课堂练习5、进行知识拓展 总结回顾 对本节课内容进行总结概括。
课后作业 研究不同的文本处理技术(如分词、去除停用词、词频统计),并在下次课上分享你的发现。总结本单元内容,完成思维导图绘制。 布置作业 拓展学生的学习能力
课堂板书 观看板书 强调教学重点内容。
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览