第5课语音识别技术课件八年级下册信息科技浙教版

资源简介

(共19张PPT)
信息科技课件
2022新版课标内容
《第5课语音识别技术》
2023年浙教版八年级下册
学习目标
1、通过对语音识别应用的体验，理解语音识别的基本过程和原理
2、了解声学模型和语音模型，感受语音识别带来的便利。
今天在我们的教室里来了一位新同学，猜猜他是谁。
问题情境
他就是豆包同学，快和他交流一下吧！
想一想
一：为什么豆包同学能够听懂我们说话呀？
二：这其中用到了人工智能的什么技术？
三：它是怎么工作的？
一、语音识别
语音识别技术（Automatic Speech Recognition）语音识别是以语音为研究对象，通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。
语音识别（ASR）
语音 “指令”或者“文本”
模拟探究：语音识别是怎么实现的？
转换
二、语音识别过程
先要了解：人是如何听到声音转化为文字的？
人类
听到声音——仔细辨别、消除杂音——比对、识别音素——依靠经验和前后语义——确定内容
① ② ③ ④ ⑤
听懂
理解
回答
二、语音识别过程
机器如何听到声音转化为文字的？
听到声音——仔细辨别、消除杂音——比对、识别音素——依靠经验和前后语义——确定内容
① ② ③ ④ ⑤
收集声音
显示结果
处理声音
豆包机器
二、语音识别过程
声音数字化
第一步
计算机用什么“听到”声音？
“听到”声音就是从模拟信号转变为数字信号的过程
二、语音识别过程
声音数字化
采样、量化、编码。声音从模拟信号转变为数字信号。
声音数字化之后，常常在电脑上以波形文件的形式呈现，如下图，我们用了大家最熟悉的scratch，录制了“喵”这个声音，得到以下波形
实验3：
“猫”和“高”的波形文件相同吗？
同一个人的说不同字波形文件相同吗？
不同的人说同一个字波形文件是否相同？
二、语音识别过程
信号预处理
第二步
2.消除杂音
人即使在嘈杂的环境中也能努力甄别有效声音，或者通过调整距离来听清，那在语音识别环节我们怎么做？
1.精准拾音
近场识别技术：可拾音距离＜1m，正常拾音距离范围≤10cm
远场识别技术：主要解决回声干扰、室内混响、多信号源干扰，从而实现较远距离的拾音.
二、语音识别过程
特征提取、模式匹配
第三特征提取、模式匹配
我和谁最像？？
声学模型
实际过程中，我们会切成更小的声音片段——音素，然后进行比对音素是最小的语音单位。查阅p27页国家的音素。
大数据在这个过程中发挥什么作用？
二、语音识别过程
语言处理
第四步
抱负？包袱？报复？
你的理想baofu是什么……
声学模型识别出单个音素，而语言模型可以让我们找出该音素出现频率最高的一个词语，同时，使得单词和单词之间的搭配符合语言习惯。
语言模型
你好的波形
n i h ao
尼好
尼号
你好
你号
去噪音
二、语音识别的过程
问：如果要让人工智能听懂家乡的方言，你觉得哪个环节要改一下？
总结：影响声音识别的因素有哪些？
你好
识别正确率的影响因素
1.对自然语言的识别与理解。
2.语音信息量太大。
3.语音的模糊性。
4.单个字母或者词、字的语音特性。受上下文的影响，以致改变重音、音调、音量和发音速度等。
5.环境噪声和干扰对语音识别有严重影响，致使识别率低。
实践：语音识别
有哪些语音识别应用？
1.siri 智能家居唤醒万物
2.会场翻译、翻译笔、微信等语音转文字
3.提取视频台词
4.记录
走进生活
飞书秒记
课堂总结
1.语音识别过程
2.声学模型
3.语言模型
4.影响声音识别的因素
语音处理系统过程
声音数字化
信号预处理
特征
提取
模式
匹配
声学
模型
音素序列
语言
处理
语言
模型
识别结果
语音输入
结果输出
INTERNET OF THINGS
谢谢聆听！

展开更多......

收起↑

请用微信扫码

第5课 语音识别技术 课件 八年级下册信息科技浙教版

第5课 语音识别技术 课件 八年级下册信息科技浙教版

第5课语音识别技术课件八年级下册信息科技浙教版

第5课语音识别技术课件八年级下册信息科技浙教版