第5课语音识别技术课件(共13张PPT) 八年级下册信息科技浙教版

资源简介

(共13张PPT)
第5课语音识别技术
曾经我们有过这样一个梦
有一扇门，一喊就能开，是什么门……
有一根棍子，一喊就能改变大小……
故事里的语音识别
一、语音识别
语音识别是以语音为研究对象，通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。其最大优势在于使得人机用户界面更加自然和容易使用。
“声控”
语音识别（ASR）
语音————————“指令”或者“文本”
模拟探究：语音识别是怎么实现的
二、语音识别过程
先要了解：人是如何听到声音转化为文字的？
人类
实验一：谢谢「ありがとうございますarigatō gozaimasu」
早上好おはよう，ou h ayo
那我开吃了いただきます（i ta da ki ma su）
（随机挑选一句测试，回想下你经历了哪些过程）
听到声音——仔细辨别、消除杂音——比对、识别音素——依靠经验和前后语义——确定内容
① ② ③ ④ ⑤
实验二：抱负？包袱？报复？
二、语音识别过程
听到声音
第一步
计算机用什么“听到”声音？
“听到”声音就是从模拟信号转变为数字信号的过程
观看以下视频的部分内容《https://www./video/BV1Sb4y1H7eW/ spm_id_from=333.337.search-card.all.click&vd_source=a3b085c6762de3a15bd46347b13fb3d4》
二、语音识别过程
声音数字化
采样、量化、编码。声音从模拟信号转变为数字信号。
声音数字化之后，常常在电脑上以波形文件的形式呈现，如下图，我们用了大家最熟悉的scratch，录制了“喵”这个声音，得到以下波形
实验3：
“猫”和“高”的波形文件相同吗？
同一个人的说不同字波形文件相同吗？
不同的人说同一个字波形文件是否相同？
二、语音识别过程
仔细听、辨别噪音
第二步
2.消除杂音
人即使在嘈杂的环境中也能努力甄别有效声音，或者通过调整距离来听清，那在语音识别环节我们怎么做？
1.精准拾音
近场识别技术：可拾音距离＜1m，正常拾音距离范围≤10cm
远场识别技术：主要解决回声干扰、室内混响、多信号源干扰，从而实现较远距离的拾音等
手机和天猫精灵分别会采用什么技术？
二、语音识别过程
特征提取、模式匹配
第三比对、识别声音
おはよう，ou h ayo
我和谁最像？？
声学模型
实际过程中，我们会切成更小的声音片段——音素，然后进行比对音素是最小的语音单位。查阅p27页国家的音素。
大数据在这个过程中发挥什么作用？
二、语音识别过程
依靠经验确定内容
第四步
抱负？包袱？报复？
你的理想baofu是什么……
声学模型识别出单个音素，而语言模型可以让我们找出该音素出现频率最高的一个词语，同时，使得单词和单词之间的搭配符合语言习惯。
你好的波形
n i h ao
尼好
尼号
你好
你号
去噪音
二、语音识别的过程
问：如果要让人工智能听懂家乡的方言，你觉得哪个环节要改一下？
总结：影响声音识别的因素有哪些？
实践：语音识别
有哪些语音识别应用？
1.siri 智能家居唤醒万物
2.会场翻译、翻译笔、微信等语音转文字
3.提取视频台词
4.记录
实践：语音识别
小飞预设的指令：向左转向右转笑一个点头
用机器人“小飞”
体验语音识别
谢谢聆听！
INTERNET OF THINGS

展开更多......

收起↑

请用微信扫码

第5课 语音识别技术 课件(共13张PPT) 八年级下册信息科技浙教版

第5课 语音识别技术 课件(共13张PPT) 八年级下册信息科技浙教版

第5课语音识别技术课件(共13张PPT) 八年级下册信息科技浙教版

第5课语音识别技术课件(共13张PPT) 八年级下册信息科技浙教版