资源简介 (共13张PPT)第5课 语音识别技术曾经我们有过这样一个梦有一扇门,一喊就能开,是什么门……有一根棍子,一喊就能改变大小……故事里的语音识别一、语音识别语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。其最大优势在于使得人机用户界面更加自然和容易使用。“声 控”语音识别(ASR)语音————————“指令”或者“文本”模拟探究:语音识别是怎么实现的二、语音识别过程先要了解:人是如何听到声音转化为文字的?人类实验一:谢谢 「ありがとうございますarigatō gozaimasu」早上好 おはよう,ou h ayo那我开吃了 いただきます (i ta da ki ma su)(随机挑选一句测试,回想下你经历了哪些过程)听到声音——仔细辨别、消除杂音——比对、识别音素——依靠经验和前后语义——确定内容① ② ③ ④ ⑤实验二:抱负?包袱?报复?二、语音识别过程听到声音第一步计算机用什么“听到”声音?“听到”声音就是从模拟信号转变为数字信号的过程观看以下视频的部分内容《https://www./video/BV1Sb4y1H7eW/ spm_id_from=333.337.search-card.all.click&vd_source=a3b085c6762de3a15bd46347b13fb3d4》二、语音识别过程声音数字化采样、量化、编码。声音从模拟信号转变为数字信号。声音数字化之后,常常在电脑上以波形文件的形式呈现,如下图,我们用了大家最熟悉的scratch,录制了“喵”这个声音,得到以下波形实验3:“猫”和“高”的波形文件相同吗?同一个人的说不同字波形文件相同吗?不同的人说同一个字波形文件是否相同?二、语音识别过程仔细听、辨别噪音第二步2.消除杂音人即使在嘈杂的环境中也能努力甄别有效声音,或者通过调整距离来听清,那在语音识别环节我们怎么做?1.精准拾音近场识别技术:可拾音距离<1m,正常拾音距离范围≤10cm远场识别技术:主要解决回声干扰、室内混响、多信号源干扰,从而实现较远距离的拾音等手机和天猫精灵分别会采用什么技术?二、语音识别过程特征提取、模式匹配第三 比对、识别声音おはよう,ou h ayo我和谁最像??声学模型实际过程中,我们会切成更小的声音片段——音素,然后进行比对音素是最小的语音单位。查阅p27页国家的音素。大数据在这个过程中发挥什么作用?二、语音识别过程依靠经验 确定内容第四步抱负?包袱?报复?你的理想baofu是什么……声学模型识别出单个音素,而语言模型可以让我们找出该音素出现频率最高的一个词语,同时,使得单词和单词之间的搭配符合语言习惯。你好的波形n i h ao尼好尼号你好你号去噪音二、语音识别的过程问:如果要让人工智能听懂家乡的方言,你觉得哪个环节要改一下?总结:影响声音识别的因素有哪些?实践:语音识别有哪些语音识别应用?1.siri 智能家居 唤醒万物2.会场翻译、翻译笔、微信等 语音转文字3.提取视频台词4.记录实践:语音识别小飞预设的指令:向左转 向右转 笑一个 点头用机器人“小飞”体验语音识别谢谢聆听!INTERNET OF THINGS 展开更多...... 收起↑ 资源预览