【核心素养目标】第3单元第4课《语音识别测试--语音识别的局限》课件+素材-【清华大学版2024】《信息科技》六上

资源简介

(共50张PPT)
第4课
语音识别测试——语音识别的局限
（清华大学版）六年级
上
1
核心素养目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
核心素养目标
信息意识
计算思维
数字化学习与创新
信息社会责任
理解并尊重同学的隐私，学会安全地收集和处理敏感数据（如个人身份信息），避免不当分享。
利用语音识别技术再思考，了解语音识别技术受到的局限性，了解语音识别技术对社会的发展具有重要的推动作用。
学习语音识别功能能识别世界上不同人群的不同语种，其能在生活中多种场景为人们提供便利。
通过语音识别，机器能够进行普通话识别测试和不同语种识别测试，机器能快速学习并掌握其中的发音特征，识别语音信息。
02
新知导入
机器能听懂人类的语言表达，且能在生活中多种场景为人们提供便利，确实是一件激动人心的事。那么语音识别功能是否能识别世界上不同人群的不同语种呢不妨结合前面所学的知识一起来探究一下。
02
新知导入
02
新知导入
思考
同学们，你们发出的每段语音都能被正确识别吗如果不能识别，思考一下，会是什么原因呢
02
新知导入
同学们，语音识别的准确性受到多种因素的影响。以下是一些可能导致识别不准确的原因：
1. 发音不清晰：如果说话者的发音不够清晰，可能会导致识别系统无法正确理解。
2. 背景噪音：在嘈杂的环境中，背景噪音可能干扰语音信号，影响识别效果。
02
新知导入
3. 口音和方言：不同的口音和方言可能会让语音识别系统难以理解，尤其是如果系统没有针对特定口音进行训练。
4. 语速过快或过慢：说话的速度如果过快，可能会导致识别系统无法跟上；而过慢则可能影响流畅性。
02
新知导入
5. 词汇和语法：如果使用了系统未能识别的专业术语或俚语，可能会导致识别错误。
6. 技术限制：语音识别技术本身也有局限性，可能无法处理某些复杂的语音输入。
思考这些因素，可以帮助我们在使用语音识别时提高准确性。
02
新知导入
03
新知讲解
一、识别测试
人在识别语音的时候，是在一套统一的语言基础上，分辨出对方所讲的语音信息，普通话便是我们日常使用的语言规则，如图3.4.1所示。
普通话识别测试
图3.4.1 普通话表达具有一定标准
03
新知讲解
一、识别测试
人们在使用普通话进行表达时，并不是所有人都能标准表达，而人们在生活中基本能分辨出大部分人所讲的普通话，是因为我们日常所接触的普通话语音输入信息非常丰富，同时也能根据具体的场景分辨出对方想要表达的内容如图 3.4.2 所示。
普通话识别测试
图 3.4.2 人能分辨不标准的普通话语音
03
新知讲解
一、识别测试
机器虽然也有大量的普通话语音数据输入，但识别时仍受各种因素的影响较大，如语音数据量不如人类接触的多，硬件设备算力不够强等。
普通话识别测试
03
新知讲解
课堂活动
1.请同学们对机器识别普通话语音的效果进行测试调研，让不同的人说同样的文字信息，观察语音识别的结果，记录识别错误的地方，尝试分析原因。将相关内容填写在表3.4.1中。
需识别的文字内容参与测试人员数量识别错误的文字原因分析
表 3.4.1 机器识别普通话语音测试记录表
03
课堂练习
需识别的文字内容参与测试人员数量识别错误的文字原因分析
你好，欢迎来到语音识别测试。 10 “好”识别为“号”； “迎”识别为“影” 发音不清晰；
背景噪音干扰
今天天气真不错。 8 1. “今”识别为“金” 语速过快；
发音相似
我们一起去看电影吧。 15 1. “一”识别为“衣” 语调变化大；
语音信号处理不佳
机器识别普通话语音测试记录表：
03
新知讲解
课堂活动
2.根据以上测试的结果，请同学们思考与讨论，机器能否识别不同的地方方言呢为什么与其他同学分享讨论结果。
03
课堂练习
机器能否识别不同的地方方言是一个复杂的问题，主要取决于几个因素：
1. 数据量和多样性：机器学习模型的训练需要大量的语音数据。如果某种方言的数据量不足，模型可能无法有效学习其特征，从而影响识别准确性。
2. 方言的差异性：不同地方的方言在发音、词汇和语法上可能有很大差异。这些差异可能导致机器在识别时出现困难，尤其是当方言与标准语的差异较大时。
03
课堂练习
3. 模型的复杂性：一些先进的语音识别模型（如深度学习模型）能够处理复杂的语言特征，但仍然需要针对特定方言进行优化和调整。
4. 上下文理解：方言中常常包含地方文化和习俗的元素，机器在理解这些上下文时可能会遇到困难。
5. 技术进步：随着自然语言处理和机器学习技术的不断进步，机器识别方言的能力也在逐步提高。许多公司和研究机构正在致力于开发能够识别多种方言的系统。
03
课堂练习
总的来说，机器识别不同地方方言的能力在不断提升，但仍然面临许多挑战。通过增加数据量、改进模型和算法，未来有望实现更高的识别准确率。与同学们分享讨论时，可以结合具体的方言案例，探讨其在识别中的表现和遇到的困难。
03
新知讲解
不同语种识别测试
根据联合国教科文组织最新发布的《世界濒危语言图谱》(2009年版)记载，全世界目前共有6000多种语言，每种语言还存在不同特征的方言和次方言。人类已掌握的语种数量的记录与现如今机器已掌握的语种数量相差并不大，由此可见，机器学习语言的速度远远超过人类。
03
新知讲解
不同语种识别测试
根据机器识别语音的原理可知，只要给予机器某种语言的丰富的语音资料，它便能快速学习并掌握其中的发音特征，识别语音信息，如图 3.4.3 所示。
图3.4.3 给予机器语音资料供它学习
03
新知讲解
实验活动
在某智能云平台中，除了提供了普通话的语音库，还提供了其他语种的语音库和 API接口供人们体验，如图3.4.4所示。
图3.4.4 某智能云平台语音识别技术
03
新知讲解
实验活动
请同学们打开编程软件，导入前面所写程序，或是重新编写程序接入不同语种的 API库，测试语音识别的准确率。
(1)打开编程软件，编写语音识别转为文字的程序。
(2)分别导入某智能云平台语音识别不同语种的 API 密钥并保存程序。
(3)测试识别不同语种语音的效果，将结果记录在表3.4.2中。
(4)分析识别结果，与同学交流。
03
新知讲解
实验活动
表 3.4.2 机器识别不同语种语音测试记录表
测试内容准确率识别错误的文字原因分析
这是什么
It's yellow and white.
你看阿个黑丘丘的东西是什么
03
课堂练习
（1）打开编程软件，编写语音识别转为文字的程序。
首先，确保你已经安装了 `speech_recognition` 库。如果没有安装，可以使用以下命令进行安装： ``` bash
pip install SpeechRecognition
然后，你可以使用以下代码来编写一个简单的语音识别程序：
```python
import speech_recognition as sr
def recognize_speech(language='en-US'):
03
课堂练习
# 创建识别器
recognizer = sr.Recognizer()
# 使用麦克风录制音频
with sr.Microphone() as source:
print("请说话...")
audio = recognizer.listen(source)
03
课堂练习
# 识别语音 try:
print("正在识别...")
text = recognizer.recognize_google(audio, language=language)
print(f"识别结果: {text}")
except sr.UnknownValueError:
print("无法理解音频")
except sr.RequestError as e:
print(f"无法请求结果; {e}")
03
课堂练习
if __name__ == "__main__":
# 选择语言
language = input("请输入语言代码 (例如: en-US, zh-CN, es-ES): ")
recognize_speech(language)
03
课堂练习
(2)分别导入某智能云平台语音识别不同语种的 API 密钥并保存程序。
如果你使用的是某个智能云平台的语音识别 API（例如 Google Cloud Speech-to-Text、Microsoft Azure Speech Service 等），你需要根据平台的文档获取 API 密钥，并在代码中进行相应的修改。
例如，如果使用 Google Cloud Speech-to-Text，你需要安装 `google-cloud-speech` 库，并在代码中使用 API 密钥进行身份验证。
03
课堂练习
```bash
pip install google-cloud-speech
然后在代码中添加 API 密钥的配置：
```python
from google.cloud import speech
def recognize_speech_with_google(language='en-US'):
client = speech.SpeechClient()
# 录音和识别的代码...
03
课堂练习
(3)测试识别不同语种语音的效果，将结果记录在表3.4.2中。
测试内容准确率识别错误的文字原因分析
这是什么 100% 无无错误
It's yellow and white. 100% 无无错误
你看阿个黑丘丘的东西是什么 80% “阿个” ——“那个 ” 口音影响，语速较快，可能导致误识别
03
课堂练习
(4)分析识别结果，与同学交流。
在测试完成后，分析不同语种的识别效果，讨论可能的原因，例如：语音清晰度、口音影响、背景噪音、语音识别模型的适应性可以通过小组讨论的方式，分享各自的测试结果和经验，寻找改进的方法。
03
新知讲解
二、语音识别技术再思考
与人相比，机器最大的优势是能够快速地记住多门语言，只要机器不断地接收新的语音数据，不断地学习，便能提高语音识别的准确率，这也是人们广泛应用语音识别的原因。但机器也有不足之处，它不能像人一样能在不同场景中迅速分辨出对方的语言表达信息，这也是语音识别技术受到一定局限性的重要原因。
03
新知讲解
二、语音识别技术再思考
相信在将来，语音识别技术会不断被优化，发挥其更大的价值，如记录濒临消失的语种，保存该语种的文化等。在对新技术发展的期待中，人们应正确看待其发展轨迹，同时自己也应主动接受语言知识，不过度依赖机器，携手共进。
04
课堂练习
语音识别技术对社会的发展具有重要的推动作用。请同学们搜集语音识别发展的优势，结合前面的语音识别测试结果的分析，整理成一份简单的测试报告，方便对整个项目的查阅，报告内容可参考表3.4.3。
实践
表 3.4.3 测试报告主要内容参考表格
测试报告
主题测试时长
测试项目一测试形式
结果分析
测试项目二测试形式
结果分析
总结
03
课堂练习
测试报告主要内容参考表格：
测试报告
主题语音识别技术的发展及其优势分析测试时长 2023年10月1日至2023年10月15日
测试项目一语音识别准确率测试测试形式 1. 选择多种语音识别软件（如度语音等）进行对比测试。
2. 采用标准化的语音输入。
3. 测试样本共计100句，涵盖日常对话、专业术语及复杂句式。
结果分析 1.准确率：不同软件的准确率在85%-95%之间，整体表现良好。 2.口音适应性：部分软件对地方口音的识别准确率较低，尤其是方言。 3.背景噪音影响：在嘈杂环境下，识别准确率普遍下降，尤其是低于80%。 4.实时反馈：大部分软件能够提供实时反馈，提升用户体验。
03
课堂练习
测试报告主要内容参考表格：
测试报告
主题语音识别技术的发展及其优势分析测试时长 2023年10月1日至2023年10月15日
测试项目二语音识别响应时间测试测试形式 1. 测试不同语音识别软件的响应时间，记录从语音输入到文本输出的时间。
2. 采用相同的语音样本，确保测试的一致性。
3. 测试环境保持一致，避免外部因素干扰。
结果分析 1.响应时间：大多数软件的响应时间在1-3秒之间，表现出色。 2.稳定性：在高负载情况下，部分软件的响应时间有所延长，需进一步优化。 3.用户体验：快速的响应时间显著提升了用户的使用体验。
05
拓展延伸
机器能学会所有语言吗
机器学习能力这么强，短时间内就能学会几十种语言，那么机器岂不是很快就能学会人类所有的语言!
机器学习语言的能力虽然强，但机器最大的问题在于所有的学习资料来自于人类也就是说学习的速度仍受制于人类，人类虽有 6000 多种语言，但很多语种已濒临消失，或是可供学习的资料不足以让机器学会这门语言。
05
拓展延伸
机器能学会所有语言吗
有道理。我查了一下，世界上有将近一半的语种正处于濒临消亡的危险境地。
是的，像科伊桑语、尤奇语、库孙达语等语种，全球只有不超过十个人在使用这种语言，若以后语音识别发展得更好，也许就能完整保存这种语言及它们背后蕴藏的文化。
05
拓展延伸
语音识别的局限性主要包括以下几个方面：
1.环境干扰：语音识别技术对环境噪声非常敏感。背景噪音、音乐声、行人喧哗等都会影响语音信号的清晰度和准确性，从而导致语音识别的准确率下降。在嘈杂的环境中，语音识别系统可能会出现错误。
2.口音和方言差异：由于国内各地方言和口音的差异，语音识别系统的识别率会受到影响。例如，一个讲普通话的人在北京说话和在上海说话时，语音识别系统的识别率会存在很大差异。

05
拓展延伸
3.技术精度问题：尽管语音识别技术的准确率已经有了很大的提升，但在一些高精度要求的领域，如医疗、金融等，语音识别的错误率仍然较高。这些领域的特殊需求使得语音识别技术需要不断改进以提高精度。
4.多语种处理：随着国际化程度的提高，多语种语音识别逐渐成为重要需求。但由于不同语言之间的差异，语音识别技术在多语种处理方面存在挑战。
05
拓展延伸
5.数据隐私和安全：语音识别技术的应用场景越来越广泛，但这也带来了数据隐私和安全方面的问题。语音助手在进行语音识别时，需要访问用户的麦克风和个人信息，如果这些信息被非法获取或滥用，将会给用户带来很大的损失。
6.语义解析误判：由于人类语言存在多义性，语音识别系统有时候可能会对使用者的真实需求产生误解，从而导致对相关信息的误读和不良处理。这可能会使用户的私人信息被意外透露给第三方，从而引发隐私泄漏的风险。
05
拓展延伸
7.法律和道德问题：在有些地方，未取得用户明确同意而收集与使用语音数据有被视为违法的风险。此外，在云端保存用户语音数据也可能产生数据主权的争论。
语音识别技术的原理：语音识别技术基于深度学习和自然语言处理（NLP）算法发展而来。它通过对大量语音数据的训练和学习，使计算机能够准确地理解和转换人类语音输入。具体过程包括语音信号处理、特征提取、模式匹配等步骤。
06
单元总结
活动日志班级：XX 姓名：XX
任务名称语音识别测试——语音识别的局限
任务环节 1口 2口 3口 4口（在对应环节画V）
任务完成内容实现语音识别测试
任务完成度口口口口口口口口口(100%)
任务小结问题与反思：项目做得不完善
改进的方法：多练习或者询问老师和同学诀窍
07
课堂总结
1
引入新知内容
语音识别测试——语音识别的局限
2
学习识别测试
3
学会语音识别技术再思考
4
完成课题练习
5
进行相关知识拓展
1
2
3
4
5
08
板书设计
语音识别测试——语音识别的局限
1.进行新知引入
2.学习识别测试
3.学会语音识别技术再思考
4.完成课堂练习
5.进行知识拓展
09
课后作业
01
在本节课完成后，想一想，不同地区的口音和方言会对识别结果产生怎样的影响？
09
课后作业
02
请同学们在小组内讨论一下，当多个说话者同时说话时，语音识别系统的准确性如何？
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

请用微信扫码

【核心素养目标】第3单元 第4课《语音识别测试--语音识别的局限》课件+素材-【清华大学版2024】《信息科技》六上

【核心素养目标】第3单元 第4课《语音识别测试--语音识别的局限》课件+素材-【清华大学版2024】《信息科技》六上

【核心素养目标】第3单元第4课《语音识别测试--语音识别的局限》课件+素材-【清华大学版2024】《信息科技》六上

【核心素养目标】第3单元第4课《语音识别测试--语音识别的局限》课件+素材-【清华大学版2024】《信息科技》六上