【甘教版】信息技术八下2.3《让机器能听会说》课件

资源简介

(共32张PPT)
第三节
让机器能听会说
学习目标
了解智能语音技术的定义
理解智能语音技术的基本原理
了解智能语音技术的发展及应用
探讨智能语音技术的应用案例
新知讲解
如何让机器具备听说能力？
智能语音技术是让机器具备人的听说能力的人工智能技术，包括语音识别及语音合成技术。
其中，语音识别技术模仿人的听觉能力，能够将人的语音转换为文字；语音合成技术模仿人的说话能力，能够将文本内容转换成语音，也可以让计算机模仿其他人的语音。
新知讲解
机器的听说过程是通过语音识别技术和语音合成技术来实现的。就像人通过学习获得听说能力一样，计算机也可以通过机器学习获得听说能力。
智能语音技术的基本原理
新知讲解
1.语音识别技术
语音识别（Automatic Speech Recognition，ASR），是一种让机器从语音中获取语言内容的技术，目的是将语音信息转变成人类可以理解的文字内容，使机器具备听觉器官，其原理如图2-3-1所示。
智能语音技术的基本原理
图2-3-1 语音识别
新知讲解
根据识别内容的范围，语音识别被分为“封闭域识别”和“开放域识别”。封闭域识别通常需要预先设定好需要识别的语音指令，机器只能识别这些特定的语音指令；开放域识别则不需要预先指定识别词的范围。
智能语音技术的基本原理
多学一手
新知讲解
拓展延伸
目前主流的语音识别是将日常生活语音转化成文本，属于开放域语音识别，看起来应用场景非常广，但如果不与人工智能结合，其应用场景还不如封闭域语音识别广。
封闭域语音识别应用场景：
1、语音做题app（或小程序）
2、远程授课语音做题
智能语音技术的基本原理
拓展延伸
例如，用语音做数学题，除了要有结果还要有步骤，用开放域语音识别来做，基本是不可能的，但如果用只含有数学语言的封闭域（简称数学域，其他类推）语音识别来做，就会很流畅。在远程授课过程中，教师和学生都可以通过语音做题，内容即时显示在屏幕上，这不仅极大的还原了真实课堂的授课体验，而且还有真实课堂无法比拟的优势。
智能语音技术的基本原理
语音识别是机器学习中常见的一个应用，分两个阶段。第一个是“训练”阶段，第二个是“识别”阶段，如图2-3-2所示。
智能语音技术的基本原理
图2-3-2 语音识别的流程
待识别语音
待识别语音
预处理
预处理
语音特征提取
语音特征提取
模型训练
模型匹配
模型库
训练
识别
输出结果
新知讲解
在训练阶段，需要准备语音和对应的文字。计算机首先对输入的语音进行预处理（去除噪声和不相干的声音），然后从语音信号中提取声学特征，最后再利用机器学习方法建立语音与对应的文字之间的对应关系，也就是识别模型。在识别阶段，计算机对待识别的语音进行相同的预处理和特征提取过程，然后将提取的特征与模型库中的模型进行匹配，进而识别出相应的结果。
智能语音技术的基本原理
新知讲解
语音和其他声音一样，也具有物理上的音高、音强、音长和音质四种要素。
音高：声音的高低，取决于发音体振动的快慢（对应于频率的高低）。音高取决于声带的形状。
音强：表示语音的强弱，主要与声带振动幅度的大小有关（对应于振幅大小）。音强取决于发音时用力的大小。
音长：语音的长短，对应于声波持续的时间。
音质：又称为“音色”，指的是语音的特色，是人的语音区别于其他声音的根本特点，音色与声道有关。
智能语音技术的基本原理
多学一手
新知讲解
2.语音合成技术
语音合成又叫文语转换（Text to Speech，TTS），是一种把文字转变成语音的技术（如图2-3-3所示），使机器能够像人一样开口说话。
智能语音技术的基本原理
图2-3-3 语音合成
新知讲解
语音合成技术也包括“训练”阶段和“合成”阶段。如图2-3-4所示，在训练阶段，需要准备文本及其对应的语音。
智能语音技术的基本原理
图2-3-4 语音合成的流程
新知讲解
首先利用“文本分析”提取出文本中每个字发音单元的发音符号，以及发音符号对应的上下文信息，同时从语音中提取出声学特征参数。然后采用机器学习算法，训练获得发音符号与声学参数的对应关系，也就是声学模型。在合成阶段，对输入的任意文本，首先经过文本分析获得文字的发音符号及其上下文信息，然后匹配声学模型产生语音参数，进而利用语音生成算法通过语音参数合成语音。
智能语音技术的基本原理
新知讲解
目前，常用的语音合成方法主要有三种：发音器官语音合成、共振峰语音合成、拼接语音合成。
发音器官语音合成让计算机模仿人的发音器官来产生语音。
共振峰语音合成用电路的形式模拟人的发声过程。
拼接语音合成将发音单元（如音素、声韵母、音节等）拼接在一起产生语音。
智能语音技术的基本原理
多学一手
新知讲解
拓展延伸
早在18世纪，奥地利发明家沃尔夫冈·冯·肯佩伦（Wolfgang von kempelen）在他生命的最后20年里一直试图模拟人类的声音，他做了一个满是洞的空盒子。空盒子与一个形状奇特的鼓风机相连。当鼓风机被按下时，它会使内置的簧片振动。这个过程模拟了人类的声音，它确实发出了声音，这也是最早的语音合成机器之一。
以此为开端，AI智能语音技术在长达一个世纪的时间里，不断飞跃提升，并最终成为了我们现在听到的样子。
智能语音技术的基本原理
近年来，随着技术的不断进步，智能语音技术的应用场景越来越广泛。例如，通过智能语音技术，可以自动评测讲话人的发音水平。智能客服利用语音识别技术获取客户的需求，并用语音合成技术进行反馈，实现语音导航、业务办理等服务。
智能语音技术的应用
新知讲解
另外，智能语音助手已经在手机、智能音箱中得到了广泛的应用。利用智能语音助手，我们可以用语音命令手机拨打电话、查询信息、设置闹钟等，可以控制智能音箱播放音乐、查询天气，甚至让它跟我们对话聊天，控制其他智能家电设备。
智能语音技术的应用
图2-3-5 智能音箱图2-3-6 语音控制的台灯
新知讲解
请同学们结合所见所闻，讨论生活中还有哪些应用使用了智能语音技术，这些应用为我们的学习和生活带来了哪些便利。
智能语音技术的应用
新知讲解
拓展延伸
1、语音输入
摆脱生僻字和拼音障碍，使用语音即时输入。略带口音的普通话、粤语四川话方言、英文，均可有效识别，并可根据句意自动纠错、自动断句添加标点，让输入更快捷，沟通交流更顺畅
2、语音搜索
搜索内容直接以语音的方式输入，应用于网页搜索、车载搜索、手机搜索等各种搜索场景，解放双手让搜索更加高效，适用于视频网站、智能硬件、手机厂商等多个行业
3、语音指令
无需手动操作，可以通过语音直接对设备或者软件发布指令，控制操作，适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域
4、社交聊天
社交聊天时直接用语音输入的方式转成文字，让输入更加便捷；或者在收到语音消息不适合播放时可以转为文字进行查看，满足更多的聊天场景
5、游戏娱乐
游戏中聊天必不可少，双手无法打字，语音输入可以将语音聊天转为文字，让用户在操作的同时也可直观看到聊天内容，多样化满足用户聊天需求
智能语音技术的应用
人们在享受智能语音技术带来的便利的同时，对存在的安全风险问题也应该给予足够的重视。例如，某科技公司发明了一套能够模仿别人语音的人工智能系统，这个系统只要录制一分钟你的语音，就能模仿你的音色说话。虽然这个系统可以应用于有声读物，但也能够用来假冒别人的声音进行诈骗。
智能语音技术的应用
新知讲解
请同学们查阅相关资料，通过正反案例总结智能语音技术的利与弊，并将查阅的结果在小组内进行讨论。
智能语音技术的应用
表2-3-1 智能语音技术的利弊思考
利处弊处
解放了双手，提高了工作效率造成了一些工作人员的失业
方便了人们的日常生活，承担家庭里各种智能家居使用的任务，提高了人们的生活水平和质量难以识别某个地方的方言、口音以及个人情绪，和人交流的时候没有情感输出
带动了未来智能家居的研发和革新，加大了与语音智能助手相关联的未来智能家居等产品的销量语音智能助手可能会泄露用户的隐私，监控我们日常生活到很多方面
新知讲解
1.任务目标
通过mBlock平台，完成语音控制小熊猫移动的任务，从而加深对语音识别的理解。
2.任务内容
（1）在mBlock里添加“人工智能服务”扩展模块。
（2）编写程序实现与小熊猫的简单互动，通过语音命令词控制小熊猫实现上、下、左、右移动。
智能语音技术的应用案例——语音控制小熊猫移动
新知讲解
3.实现步骤
（1）在左下角的“添加扩展”里，找到“人工智能服务”，如图2-3-7所示，点击加载，就可以在主页面看到该模块的所有积木。
（2）在运动积木类里，找到积木
并将x和y的值都改为0，使角色小熊猫位于舞台正中间。
智能语音技术的应用案例——语音控制小熊猫移动
图2-3-7 人工智能服务
新知讲解
（3）在积木区找到“语音交互”，通过、
和三个积木设置语音合成提示语，然后通过积木进行语音识别。
当识别结果中包含特定的命令词时，舞台中间的小熊猫会根据指令做出相应的运动，小熊猫移动的方向与距离通过和
两个积木进行设置。
智能语音技术的应用案例——语音控制小熊猫移动
新知讲解
（4）按照图2-3-8所示的示例程序连接组合前两步中的积木，并点击相应的积木自行设置语音合成提示语和小熊猫移动的距离。
（5）点击运行按钮，根据语音提示语，随机说出语音命令词，观察舞台中小熊猫的运动情况。
（6）在图2-3-8所示的示例程序的基础上，自行编写程序让小熊猫实现更多的功能。
智能语音技术的应用案例——语音控制小熊猫移动
图2-3-8 语音控制小熊猫移动的示例程序
新知讲解
在积木前面的方框内打勾，这样在说出语音命令词时，可以在舞台左上角实时显示语音识别的结果，如图2-3-9 所示。
智能语音技术的应用案例——语音控制小熊猫移动
图2-3-9 语音识别结果
新知讲解
请同学们根据前面所学的知识，首先在mBlock平台中点击添加“人工智能服务”扩展模块，然后使用“语音交互”中的语音识别积木和朗读积木
、“外观”中的积木，
以及积木区的其他积木，使小熊猫跟着你朗读一首诗，并将识别的诗句显示在舞台区，如图2-3-10所示。
智能语音技术的应用案例——语音控制小熊猫移动
图2-3-10 舞台区显示识别诗句
新知讲解
课堂总结
这节课我们学习了智能语音技术的基本原理，了解了语音识别的“封闭域识别”和“开放域识别”的区别，以及智能语音技术在生活中的应用，并按照课本案例利用软件成功用语音控制小熊猫移动。
板书设计
智能语音技术的基本原理
智能语音技术的应用
智能语音技术的应用案例——语音控制小熊猫移动

展开更多......

收起↑

请用微信扫码

【甘教版】信息技术八下2.3《让机器能听会说》课件

【甘教版】信息技术八下2.3《让机器能听会说》课件