4.2 大数据处理-数据可视化之词云 教学设计-2023—2024学年浙教版高中信息技术(2019)必修1

资源下载
  1. 二一教育资源

4.2 大数据处理-数据可视化之词云 教学设计-2023—2024学年浙教版高中信息技术(2019)必修1

资源简介

4.2《大数据处理-数据可视化之词云》
教材分析
本节课是浙教版《数据与计算》必修一第四章第二节大数据处理中《文本数据处理》的内容。本节主要介绍了文本处理的相关内容,包含文本处理的一般过程以及文本数据分析与应用。本节要求学生通过典型案例应用实例,了解数据采集、分析和可视化表达的基本方法,并能根据任务需求,选用恰当的软件工具或平台处理数据。针对教学目标,本节课采用最近热点问题《政府工作报告》展开,对该文本内容进行可视化处理。考虑到学生已经熟练掌握Python基本编程知识,具备相应的编程能力,对于创新性内容比较感兴趣,设计了词云制作这一实践活动。
课程标准和教学目标
本节课项目:
《基于政府工作报告的可视化处理》课程标准:
1.4通过典型的应用实例,了解数据采集、分析和可视化表达的基本方法。
1.5根据任务需求,选用恰当的软件工具或平台处理数据。
教材内容 第四章4.2.3文本数据处理
教学目标
1.了解文本数据处理的目的、应用、一般过程和方法。
2.了解文件读取文本数据的方法以及中文分词常见的方法。
3.掌握数据词云的概念、历史,了解制作词云的基本步骤。
指向的核心素养
1.信息意识:能够在体验与探究过程中自主获取有效信息,并勇于展示与分享。
2.计算思维:能够对给定的任务进行需求分析,抽象问题的本质,设计相应的算法,用程序设计语言实现相关算法。
教学环境 多媒体网络教室、Python3.8编程环境(wordcloud、jieba、numpy库已安装)
教学重难点
文本数据的获取文本数据的分词用python制作可视化词云
教学过程
教学环节 教学过程 设计意图
回顾总结 回顾在前几课中学习的关于数据可视化处理的案例,总结对于EXCEL表格形式的数据常用的可视化方法。总结出这些数据共同特征是数值类型。 对之前的学习内容进行归纳与总结,再一次明确可视化处理的作用---能够高效、快速、清晰、准确的把握数据中包含的信息,为项目的引入做好铺垫
问题导入 2023年3月5日第十四届全国人民代表大会上国务院总理李克强同志所作的政府工作报告的字数达到了18915,如何快速获取该报告中所包含的信息呢?对于文本数据的处理,最常用的处理方式是词云。展示生活中有关词云的图片。 引入项目,明确本堂课的主要任务,同时向学生展示词云的图片,一方面激发学生学习兴趣,另一方面让学生对词云有一个形象直观的认识
体验与探究一 四行代码制作一个词云。 让学生打开python编辑器,自主输入以下四行代码。 Import word cloud w=word cloud. Word Cloud( ) w.generate ("hello, word, input, print") w.to_file("词云1.png") 运行后,在python的根目录底下查看生成的词云图片 通过实践一:学生可以亲身体验与感受用python制作词云的过程,同时,在制作的过程中可以引发学生对于如何制作词云的思考,为后续的展示与交流做好铺垫。
展示与交流 学生展示用python编码制作的词云效果。教师讲解用python制作词云的一般过程与方法: 引入词云库; 生成词云对象; 导入文本内容; 生成词云图片。 师生探讨制作出的词云的感受,引出实践二要体验与探究的内容,继续美化词云。 学生展示编码后的结果,对在编码过程中出现的问题进行总结。师生交流引出实践二体验与探究的内容。
体验与探究二 修改word cloud( )参数内容,美化词云。 Import numpy as np From PIL import Image Import word cloud mask=np.array(Image.open("alice_mask.png")) txt="Alice,漂亮、温柔、贴心、有爱心、友善、大方、热情、开朗、活泼、能歌善舞 "w=wordcloud. WordCloud ( #修改背景颜色 #修改字体 #修改蒙版 #修改字体颜色 #修改重复 #修改尺寸 #修改轮廓颜色和宽度) w. generate(txt) w. to_file("词云2.png") 技术支持:Word Cloud( )各个参数使用案例如下:background_color="white", repeat=True, font_path="STXINWEI.TTF", mask=mask, contour_width=2, contour_color="pink" 通过实践三:让学生自主去探索解决问题的方法,锻炼其利用编程设计语言实现算法的能力。代码采用开放式形式,对于重要需要掌握的内容进行补全,其他代码可以在基础上进行修改,一方面可以锻炼学生的创新能力,另一方面培养学生的自主学习能力
展示与交流 学生展示美化后的词云效果。对于编码过程出现的问题进行总结。总结实践一和实践二生成词云的数据有何特点。回归课程最开始提出的问题,如何读取该文本内容并进行分词呢?讲解文件读取数据的方式。利用jieba( )库进行分词的方法。提出实践三自主与探究的内容与要求 通过展示与交流,引发学生自主思考。层层递进式的提问,让学生更加明确目标,找到解决问题的方法。
体验与探究三 修改补充project3.py,完成《政府工作报告》词云制作 From wordcloud import Word Cloud Import numpy as np From PIL import Image import os import jieba f=open( ) #打开文件txt=#读取文件 ss=#jieba分词补全代码mask=np. array(Image.open("ChinaMap.png")) wcd=WordCloud(background_color="white", repeat=True, font_path="STXIHEI.TTF", colormap="Reds", mask=mask,contour_width=8, contour_color="red") wcd. generate(ss) wcd.to_file("词云3.png")
展示与交流 学生展示对政府工作报告文本可视化处理后的结果。对于词云进行包含的信息进行解读。与学生交流“词云”的概念。 通过前边三个实践操作,学生对于词云有了一定的认识,通过交流的方式,培养学生在自主实践中获取信息的能力。
总结归纳 播放微视频《大数据处理数据可视化之词云》。展示了词云产生的背景、词云的概念、作用。总结归纳文本处理的一般过程。 了解词云的专业性概念,让学生掌握专业性语言,形成信息技术专业素养。
课上练习 师生共做课上练习,检验学习效果 通过课上练习,查看学生的掌握情况。
《大数据处理数据可视化之词云》课后反思
《大数据处理数据可视化之词云》这节课围绕《基于政府工作报告的可视化处理》这一项目进行展开,设计了从简到难的三个实践项目,让学生在动手实践过程中不断明确问题,抽象建模、设计出解决问题的算法,并利用程序设计语言实现,解决问题。本节课学生参与度高、积极动手实践、对代码进行大胆创新设计,勇于展示与分享。在自主学习过程中不断获取信息,生成对词云的认识,能自主总结出词云的概念。
本节课整体效果不错,但是还有以下两点需要改进:
1.由于时间的原因,在展示与交流环节,可以把更多的主动权给到更多的学生,让更多的学生去参与进来。
2.学生在展示成果的过程中,语言略显匮乏,这也提醒在以后的教学过程中注重学生信息技术专业用语的培养,让学生学会展示与分享自己的成果。

展开更多......

收起↑

资源预览