资源简介 (共54张PPT)第3单元 第1课初识语音识别——语音识别技术应用(清华大学版)六年级上1核心素养目标3新知讲解5拓展延伸7板书设计2新知导入4课堂练习6课堂总结课后作业801核心素养目标信息意识计算思维数字化学习与创新信息社会责任理解并尊重同学的隐私,学会安全地收集和处理敏感数据(如语音),避免不当分享。利用语音识别了解学习语音识别的过程,学会语音识别技术项目应用设计。学习用语音与机器进行交流,让机器明白你说什么,并按照你说的话执行某些指令,并规范使用语音识别技术。能够了解认识语音识别技术的原理和应用,认识机器的“听觉系统”语音识别。02新知导入要让机器模拟人类的智能,就要先模拟人类的感官智能,使机器不仅能跟人类一样慧眼识物、察颜观色,还能模拟人类的听觉能力,理解人类语言的内涵,这样才能让机器更好地跟人们进行交流。本节课,我们就来认识机器的“听觉系统”——语音识别吧!02新知导入02新知导入思考同学们,请思考一下,你们认为什么是语音识别,生活中你们有没有见到过语音识别的例子,和同学们讨论交流一下。02新知导入语音识别是指计算机或其他设备能够识别和理解人类语音的技术。它通过将声音信号转化为文本或指令,使得人们可以通过说话来与设备进行交互。02新知导入在生活中,我们可以看到许多语音识别的例子,比如:1. 智能助手:像Siri、Google Assistant和Alexa等智能助手,可以通过语音指令执行任务,比如设置闹钟、查询天气、播放音乐等。2. 语音输入:在手机或电脑上,我们可以使用语音输入功能,将说的话直接转换为文字,方便快捷。02新知导入3. 导航系统:许多车载导航系统支持语音指令,驾驶者可以通过语音来输入目的地或调整路线。4. 客服系统:一些公司使用语音识别技术来处理客户的电话咨询,自动识别客户的需求并提供相应的服务。02新知导入03新知讲解一、认识语音识别技术用语音与机器进行交流,让机器明白你说什么,并按照你说的话执行某些指令,这就是人们在最初研究机器智能时梦寐以求的事情,而今天这种技术已经飞入寻常百姓家。03新知讲解语音识别技术的含义语音识别技术也被称为自动语音识别,目标是将人类语音中的词汇或语义内容转换为计算机可读的输入指令,如图3.1.1所示。可以把机器的语音识别简单理解为“机器的听觉系统”,目的是让机器听懂人说的话,并按人类下达的指令执行任务。03新知讲解语音识别技术的含义图 3.1.1 将语音转换为文字或指令03新知讲解语音识别的发展针对语音识别技术的研究从 20世纪50年代开始到现在已经历了半个多世纪,经过艰难的探索获得了巨大的进展。1952 年贝尔实验室研究成功了世界上第一个能识别10个英文数字发音的实验系统;20世纪70年代,科学家在小词汇量、孤立词的识别方面取得了实质性的进展;到20世纪80年代语音识别技术逐渐由孤立词识别转向连接词识别。语音识别的发展过程如图 3.1.2 所示。03新知讲解语音识别的发展图 3.1.2 语音识别由开始的识别词升级为识别句子03新知讲解语音识别的发展1987 年,科学家开发出了世界上第一个“非特定人连续语音识别系统”用统计的方法提高了语音识别准确率,如图 3.1.3 所示。图3.1.3 语音识别不断优化,准确率提升03新知讲解语音识别的发展20 世纪 90年代,大词汇量连续语音识别得到了优化;1997 年首个语音听写产品问世,只要对着话筒说出要输入的字符,它就会自动判断并帮你输入文字。2011年年初,某企业的深度神经网络(DNN)模型在语音搜索任务上获得成功,之后多家国内企业将 DNN 模型应用到中文语音识别领域。03新知讲解语音识别的发展如今,语音识别技术逐渐实现产品化,并嵌入移动设备,如手机、计算机等,以及穿戴式设备如电话手表等进行使用。手机使用语音识别技术的示例如图 3.1.4 所示。人机交互的方式翻开了新的篇章。图3.1.4 手机使用了语音识别技术03新知讲解课堂活动同学们,你能总结一下语音识别技术发展的过程吗 和同学们一起分享交流吧!03课堂练习语音识别技术的发展过程可以分为以下几个主要阶段 :1、1950年代至1960年代 :语音识别技术的早期起源。这一时期的语音识别技术主要是基于手工编写的规则和模板的方法,用于识别单词和短语 。 2、1970年代至1980年代 :基于Hidden Markov Model(HMM)的语音识别技术出现。这一阶段研究者们开始使用HMM模型来描述语音信号,并开发了一系列的语音识别算法 。 03课堂练习3、1990年代至2000年代 :深入研究语音识别算法的阶段。研究者们开始探索各种不同的语音识别算法,包括神经网络、支持向量机、决策树等,尤其是循环神经网络(RNN)和长短期记忆网络(LSTM)的应用,显著提升了语音识别的性能 。4、2010年代至今 :深度学习驱动的语音识别技术飞速发展。随着深度学习技术的出现和发展,特别是卷积神经网络(CNN)和RNN的广泛应用,语音识别技术得到了巨大的提升。2015年后,端到端方法的兴起进一步推动了语音识别性能的提升,使得语音识别的准确性首次超越了人类。 03新知讲解二、语音识别技术的应用语音识别技术已经融入了人们的日常生活中,关于语音识别技术的应用主要体现在两个方面:语音输入和语音控制。03新知讲解语音输入,即将说话人的语音实时地转化为文字。相对于键盘输入法,语音输入更符合人们的日常习惯,也更自然、高效。语音输入系统可以用于会议的实时记录、语音搜索等方面。如图 3.1.5 所示,手机中有连续的语音输入时还可以自动更新、纠正文字,并进行合理的断句。语音输入03新知讲解语音输入图 3.1.5 语音识别实时将输入的语音转化为文字03新知讲解语音控制,即将说话人的语音转化为指令来控制设备的运行。这种方式相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域。语音控制家居设备的应用场景如图 3.1.6 所示。语音控制03新知讲解语音控制图3.1.6 语音控制家居设备03新知讲解课堂活动同学们,你们还能想到语音识别技术应用在哪些领域吗 和同学们一起分享交流一下。03课堂练习语音识别技术在多个领域都有广泛应用:在智能家居中,语音识别技术使得用户可以通过声音指令控制各种家居设备,如智能音箱、智能电视、智能灯具、空调等。用户只需通过简单的语音指令就可以实现对设备的开启、关闭、调节等操作,极大地提高了使用的便捷性 12。此外,语音识别技术还可以设置情景模式,如“回家”模式,自动开启灯光、调节温度、播放音乐等,使家居环境更加智能化和个性化 。03课堂练习在汽车领域,语音识别技术可以帮助驾驶员进行各种操作,如拨打电话、导航、调节空调等,而无需分散注意力去操作物理按钮或触摸屏。这不仅提高了驾驶的安全性,也提升了驾驶体验 。语音识别技术的智能化也让玩具行业进行了变革,越来越多的智能玩具被研发出来,如智能语音娃娃、智能语音儿童机器人。用户可以通过语音与这些玩具进行简单交流,完成一些简单的任务 。03课堂练习在工业及医疗领域,语音识别技术能够解放双手,只需对机器发出命令,即可让其操作完成需要的任务,大大提升了工作效率 。在医疗领域,语音识别技术可以协助医生快速记录病历和治疗方案,提高工作效率 。在智能教育方面,AI语音技术可以作为课堂质量辅助和线上虚拟助手,提供个性化的学习体验 。03新知讲解三、语音识别体验活动活动主题:语音输入图 3.1.7 项目准备工具活动准备(见图 3.1.7)03新知讲解三、语音识别体验活动活动操作说明将程序文件导入编程软件中,再将计算机和 AIoT板相连接,从智能云平台中获得语音识别的 API,粘贴在编程平台的语音识别程序指令中,将程序刷入 AIoT板;接着按下 AIoT 板的A键开始录音,录音时长可为 2~5 秒;最后在 AIoT 板OLED 显示屏上可以看到识别结果。整个过程需要连接 Wi-Fi。03新知讲解三、语音识别体验活动示例程序 (见图 3.1.8)图3.1.8 AIoT 板语音识别转文字程序示例03课堂练习找到语音识别 API:搜索“智能云”进入网址→注册、登录→控制台→产品服务一人工智能语音能力引擎一创建语音识别应用→概览一领取语音识别免费资源→应用列表→获得 API Key 和 Secret Key。温馨小贴士04课堂练习根据体验活动,请同学们思考一下,机器实现语音识别的必要条件有哪些。请同学们讨论交流,并将结果写在下面的空白处。实践03课堂练习实现语音识别的必要条件主要包括以下几个方面:1. 高质量的音频输入:- 清晰的音频信号,尽量减少背景噪音。- 适当的麦克风设备,能够准确捕捉语音。2. 语言模型:- 需要一个强大的语言模型,以理解和预测语音中的单词和句子结构。- 语言模型应涵盖目标语言的词汇、语法和常用表达。03课堂练习3. 声学模型:- 声学模型用于将音频信号转换为音素或词。- 需要大量的语音数据进行训练,以提高识别准确率。4. 数据处理能力:- 强大的计算能力,以实时处理和分析音频数据。- 需要高效的算法来进行特征提取和模式识别。03课堂练习5. 训练数据:- 大量多样化的语音数据集,用于训练和验证模型。- 数据集应包括不同口音、语速和语调的样本。6. 用户适应性:- 系统应能够适应不同用户的语音特征,包括口音、语速和发音习惯。- 可能需要个性化的训练或调整。03课堂练习7. 上下文理解:- 理解语境和上下文,以提高识别的准确性。- 需要结合语境信息来处理同音词或多义词。8. 反馈机制:- 用户反馈机制,以不断改进和优化识别系统。- 通过用户的使用数据来调整模型,提高准确性。05拓展延伸非特定人语音识别它们有什么区别吗 语音识别技术可以分为特定人语音识别和非特定人语音识别。05拓展延伸非特定人语音识别哪一种更简单,哪一种更实用呢 特定人语音识别技术是针对一个特定的人的识别技术,简单说就是只能识别特定某个人的声音,不适用于更广泛的群体;而非特定人语音识别技术恰恰相反,不针对特定个体,也不分年龄、性别与特征,只要音源相同就可以识别。它可以满足一类人群的语音识别要求,适合更广泛的群体应用。05拓展延伸非特定人语音识别非特定人语音识别系统适合公共产品或公共服务领域应用,特定语音识别结合声纹识别等技术更适合家庭与小规模特定场景。两种技术各有优劣,应根据具体应用合理选择。05拓展延伸语音识别技术常用的方法有如下四种:1. 基于语言学和 声学的方法,2. 随机模型法,3. 利用人工神经网络的方法,4. 概率语法分析。其中最主流的方法是随机模型法。05拓展延伸基于语言学和声学的方法基于语言学和声学的方法是最早应用于语音识别的方法,但是这种方法涉及的知识太过于困难,导致现在并没有得到大规模普及。05拓展延伸随机模型法随机模型法目前应用较为成熟,该方法主要采用提取特征、训练模板、对模板进行分类及对模板进行判断的步骤来对语音进行识别。该方法涉及到的技术一般有3种:动态时间规整(DTW),隐马尔科夫模型(HMM)理论和矢量量化(VQ )技术。其中,HMM 算法相较于其他两者的优点是简便优质, 在语音识别性能方面更为优异。也正因为如此,如今大部分语音识别系统都在使用HMM算法。05拓展延伸神经网络的方法(ANN)神经网络方法是在语音识别发展的后期才有的一种新的识别方法。它其实是一种模拟人类神经活动的方法,同时具有人的一些特性,如自动适应和自主学习。其较强的归类能力和映射能力在语音识别技术中具有很高的利用价值。业界将 ANN 与传统的方法进行结合,各取所长,使得语音识别的效率得到了显著的提升。05拓展延伸概率语法分析法概率语法分析法是一种能够识别大长度语段的技术,主要是为了完成“区别语言的特征”,对于不同层次的知识利用相应层次的知识来解决。这种方法最大的不足就是,建立一个有效、适宜的适用知识系统存在着一定的困难。06单元总结活动日志 班级:XX 姓名:XX任务名称 初识语音识别——语音识别技术应用任务环节 1口 2口 3口 4口(在对应环节画V)任务完成内容 体验语音识别技术任务完成度 口口口口口口口口口(100%)任务小结 问题与反思:项目做得不完善改进的方法:多练习或者询问老师和同学诀窍07课堂总结1引入新知内容初识语音识别——语音识别技术应用2学习语音识别技术的含义和发展3学习语音识别技术的应用4完成课题练习5进行相关知识拓展1234508板书设计初识语音识别——语音识别技术应用1.进行新知引入2.学习语音识别技术的含义和发展3.学习语音识别技术的应用4.完成课堂练习5.进行知识拓展09课后作业01在本节课完成后,想一想,你觉得语音识别技术有什么好处?有没有可能的坏处?09课后作业02请同学们在小组内讨论一下,你认为语音识别技术会改变我们日常生活中的哪些方面?https://www.21cnjy.com/recruitment/home/fine 展开更多...... 收起↑ 资源列表 【清华大学出版社】《信息科技》六年级上册第三单元第1课《初识语音识别——语音识别技术应用》.pptx 新知导入.mp4