资源简介 中小学教育资源及组卷应用平台《让机器能听会说》教学设计课题 《让机器能听会说》 单元 第二单元 学科 信息科技 年级 八年级教材分析 这节课介绍了智能语音技术的基本原理,以及智能语音技术的定义,了解了语音识别的“封闭域识别”和“开放域识别”的区别,了解智能语音技术的发展及应用,并按照课本案例利用软件成功用语音控制小熊猫移动。学习目标 了解智能语音技术的定义理解智能语音技术的基本原理了解智能语音技术的发展及应用探讨智能语音技术的应用案例重点 了解智能语音技术的发展和应用。难点 利用原理用语音控制小熊移动。教学过程教学环节 教师活动 学生活动 设计意图导入新课 师:如何让机器具备听说能力?智能语音技术是让机器具备人的听说能力的人工智能技术,包括语音识别及语音合成技术。其中,语音识别技术模仿人的听觉能力,能够将人的语音转换为文字;语音合成技术模仿人的说话能力,能够将文本内容转换成语音,也可以让计算机模仿其他人的语音。 了解智能语音的定义 引出智能语音的定义引发学生的兴趣讲授新课 智能语音技术的基本原理机器的听说过程是通过语音识别技术和语音合成技术来实现的。就像人通过学习获得听说能力一样,计算机也可以通过机器学习获得听说能力。1.语音识别技术语音识别(Automatic Speech Recognition,ASR),是一种让机器从语音中获取语言内容的技术,目的是将语音信息转变成人类可以理解的文字内容,使机器具备听觉器官,其原理如图2-3-1所示。图2-3-1 语音识别多学一手根据识别内容的范围,语音识别被分为“封闭域识别”和“开放域识别”。封闭域识别通常需要预先设定好需要识别的语音指令,机器只能识别这些特定的语音指令;开放域识别则不需要预先指定识别词的范围。拓展延伸目前主流的语音识别是将日常生活语音转化成文本,属于开放域语音识别,看起来应用场景非常广,但如果不与人工智能结合,其应用场景还不如封闭域语音识别广。封闭域语音识别应用场景:1、语音做题app(或小程序)2、远程授课语音做题例如,用语音做数学题,除了要有结果还要有步骤,用开放域语音识别来做,基本是不可能的,但如果用只含有数学语言的封闭域(简称数学域,其他类推)语音识别来做,就会很流畅。在远程授课过程中,教师和学生都可以通过语音做题,内容即时显示在屏幕上,这不仅极大地还原了真实课堂的授课体验,而且还有真实课堂无法比拟的优势。语音识别是机器学习中常见的一个应用,分两个阶段。第一个是“训练”阶段,第二个是“识别”阶段,如图2-3-2所示。图2-3-2 语音识别的流程在训练阶段,需要准备语音和对应的文字。计算机首先对输入的语音进行预处理(去除噪声和不相干的声音),然后从语音信号中提取声学特征,最后再利用机器学习方法建立语音与对应的文字之间的对应关系,也就是识别模型。在识别阶段,计算机对待识别的语音进行相同的预处理和特征提取过程,然后将提取的特征与模型库中的模型进行匹配,进而识别出相应的结果。多学一手语音和其他声音一样,也具有物理上的音高、音强、音长和音质四种要素。音高:声音的高低,取决于发音体振动的快慢(对应于频率的高低)。音高取决于声带的形状。音强:表示语音的强弱,主要与声带振动幅度的大小有关(对应于振幅大小)。音强取决于发音时用力的大小。音长:语音的长短,对应于声波持续的时间。音质:又称为“音色”,指的是语音的特色,是人的语音区别于其他声音的根本特点,音色与声道有关。2.语音合成技术语音合成又叫文语转换(Text to Speech,TTS),是一种把文字转变成语音的技术(如图2-3-3所示),使机器能够像人一样开口说话。图2-3-3 语音合成语音合成技术也包括“训练”阶段和“合成”阶段。如图2-3-4所示,在训练阶段,需要准备文本及其对应的语音。首先利用“文本分析”提取出文本中每个字发音单元的发音符号,以及发音符号对应的上下文信息,同时从语音中提取出声学特征参数。然后采用机器学习算法,训练获得发音符号与声学参数的对应关系,也就是声学模型。在合成阶段,对输入的任意文本,首先经过文本分析获得文字的发音符号及其上下文信息,然后匹配声学模型产生语音参数,进而利用语音生成算法通过语音参数合成语音。多学一手目前,常用的语音合成方法主要有三种:发音器官语音合成、共振峰语音合成、拼接语音合成。发音器官语音合成让计算机模仿人的发音器官来产生语音。共振峰语音合成用电路的形式模拟人的发声过程。拼接语音合成将发音单元(如音素、声韵母、音节等)拼接在一起产生语音。拓展延伸 早在18世纪,奥地利发明家沃尔夫冈·冯·肯佩伦(Wolfgang von kempelen)在他生命的最后20年里一直试图模拟人类的声音,他做了一个满是洞的空盒子。空盒子与一个形状奇特的鼓风机相连。当鼓风机被按下时,它会使内置的簧片振动。这个过程模拟了人类的声音,它确实发出了声音,这也是最早的语音合成机器之一。 以此为开端,AI智能语音技术在长达一个世纪的时间里,不断飞跃提升,并最终成为了我们现在听到的样子。近年来,随着技术的不断进步,智能语音技术的应用场景越来越广泛。例如,通过智能语音技术,可以自动评测讲话人的发音水平。智能客服利用语音识别技术获取客户的需求,并用语音合成技术进行反馈,实现语音导航、业务办理等服务。另外,智能语音助手已经在手机、智能音箱中得到了广泛的应用。利用智能语音助手,我们可以用语音命令手机拨打电话、查询信息、设置闹钟等,可以控制智能音箱播放音乐、查询天气,甚至让它跟我们对话聊天,控制其他智能家电设备。请同学们结合所见所闻,讨论生活中还有哪些应用使用了智能语音技术,这些应用为我们的学习和生活带来了哪些便利。1、语音输入摆脱生僻字和拼音障碍,使用语音即时输入。略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅2、 语音搜索搜索内容直接以语音的方式输入,应用于网页搜索、车载搜索、手机搜索等各种搜索场景,解放双手让搜索更加高效,适用于视频网站、智能硬件、手机厂商等多个行业3、 语音指令无需手动操作,可以通过语音直接对设备或者软件发布指令,控制操作,适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域4、 社交聊天社交聊天时直接用语音输入的方式转成文字,让输入更加便捷;或者在收到语音消息不适合播放时可以转为文字进行查看,满足更多的聊天场景5、 游戏娱乐游戏中聊天必不可少,双手无法打字,语音输入可以将语音聊天转为文字,让用户在操作的同时也可直观看到聊天内容,多样化满足用户聊天需求人们在享受智能语音技术带来的便利的同时,对存在的安全风险问题也应该给予足够的重视。例如,某科技公司发明了一套能够模仿别人语音的人工智能系统,这个系统只要录制一分钟你的语音,就能模仿你的音色说话。虽然这个系统可以应用于有声读物,但也能够用来假冒别人的声音进行诈骗。请同学们查阅相关资料,通过正反案例总结智能语音技术的利与弊,并将查阅的结果在小组内进行讨论。表2-3-1 智能语音技术的利弊思考智能语音技术的应用案例——语音控制小熊猫移动1.任务目标 通过mBlock平台,完成语音控制小熊猫移动的任务,从而加深对语音识别的理解。2.任务内容(1)在mBlock里添加“人工智能服务”扩展模块。(2)编写程序实现与小熊猫的简单互动,通过语音命令词控制小熊猫实现上、下、左、右移动。3.实现步骤(1)在左下角的“添加扩展”里,找到“人工智能服务”,如图2-3-7所示,点击加载,就可以在主页面看到该模块的所有积木。图2-3-7 人工智能服务(2)在运动积木类里,找到积木移到x40y-20,并将x和y的值都改为0,使角色小熊猫位于舞台正中间。(3)在积木区找到“语音交互”,通过发音人设置标准男声、将语速设为5和朗读makeblock 童心制物直到结束三个积木设置语音合成提示语,然后通过积木开始普通话语音识别,持续2进行语音识别。当识别结果中包含特定的命令词时,舞台中间的小熊猫会根据指令做出相应的运动,小熊猫移动的方向与距离通过将x坐标增加10和将y坐标增加10两个积木进行设置。(4)按照图2-3-8所示的示例程序连接组合前两步中的积木,并点击相应的积木自行设置语音合成提示语和小熊猫移动的距离。(5)点击运行按钮,根据语音提示语,随机说出语音命令词,观察舞台中小熊猫的运动情况。(6)在图2-3-8所示的示例程序的基础上,自行编写程序让小熊猫实现更多的功能。图2-3-8 语音控制小熊猫移动的示例程序在积木语言识别结果前面的方框内打勾,这样在说出语音命令词时,可以在舞台左上角实时显示语音识别的结果,如图2-3-9 所示。图2-3-9 语音识别结果请同学们根据前面所学的知识,首先在mBlock平台中点击添加“人工智能服务”扩展模块,然后使用“语音交互”中的语音识别积木开始普通话语音识别,持续2和语音识别结果、朗读积木朗读makeblock 童心制物直到结束、“外观”中的积木你好!以及积木区的其他积木,使小熊猫跟着你朗读一首诗,并将识别的诗句显示在舞台区,如图2-3-10所示。图2-3-10 舞台区显示识别诗句 学习语音识别的技术的定义了解语音识别的两种方式拓展学习封闭式语音识别在生活中的运用了解语音识别的流程认识音高,音强,音长和音质的概念了解语音合成技术的流程拓展学习常用的三种语音合成的方法拓展学习关于智能语音的趣事拓展学习生活中其他关于智能语音技术的应用学习按步骤完成程序设置并完成语音控制移动学习利用所学知识创建如图诗句在编程软件中学习按步骤操作并运用人工智能的服务 介绍智能 语音识别的原理激发学生的探索的兴趣拓展内容以让学生丰富课本以外关于智能语音的知识点可提出疑问让学生展开讨论通过介绍音高等知识引导学生对语音的概念有概念的了解通过合成技术的展示为下一步实践操作做准备以趣事为基础引发学生的思考和对知识点的理解通过拓展激发学生对生活中运用的理解和认识适当在案例中提出问题让学生参与讨论并巩固知识点先进行讨论后展示利弊的补充点,引发学生充分思考实践操作语音控制系统有助于提高学生对本节课内容的加深理解总结实践中遇到的问题并让学生自主探索应该如何运行程序课堂小结 这节课我们学习了智能语音技术的基本原理,了解了语音识别的“封闭域识别”和“开放域识别”的区别,以及智能语音技术在生活中的应用,并按照课本案例利用软件成功用语音控制小熊猫移动。 总结 对本节课内容进行总结概括。板书 智能语音技术的基本原理智能语音技术的应用智能语音技术的应用案例——语音控制小熊猫移动21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源预览