资源简介 (共36张PPT)第一单元 第4课机器的耳朵清华版(中学)通1学习目标3新知讲解5拓展延伸7板书设计2新知导入4课堂练习6课堂总结课后作业801教学目标(1)了解机器听觉的基本概念及其研究方向。(2)理解语音识别、声纹识别和声音事件检测的基本原理与应用场景。02新知导入02新知导入机器的耳朵能让机器感知声音,助力机器听觉实现,用于采集、传递声音信息,使机器可 “倾听” 世界(包括人类声音、自然界声音等 )的声音采集及处理相关装置或系统,就是机器的 “耳朵” 。02新知导入机器听觉研究如何让机器感知声音的学科称为机器听觉(computational auditory),它既包括识别人类的声音,也包括感知自然界的声音。02新知导入机器听觉思考——机器听觉的研究方向有哪些?(1)语音识别。(2)声纹识别。(3)声音事件检测。02新知讲解语音识别从声音信号中提取发音内容的任务称为语音识别。02新知讲解语音识别科大讯飞输入法,语音转文字高效准确,覆盖多种场景输入。苹果 Siri ,智能语音助手,识别语音指令执行操作。03新知讲解语音识别原理03新知讲解语音识别的发展语音识别的发展语音识别02新知讲解语音识别应用智能语音助手智能家居场景语音控制轮椅02新知讲解语音识别应用声音报警——校园霸凌声音报警——老人居家监护无人驾驶汽车导航03新知讲解声纹识别声纹识别概念每个人的声音都是独一无二的,类似于指纹,声音的特征被称为“声纹”,通过声音来判断发音人身份的技术称为“声纹识别”。03新知讲解声纹识别声智科技声纹身份认证系统,用于金融等领域远程身份核验。03新知讲解声纹识别腾讯云智聆声纹服务 ,可实现声纹注册、验证等,保障账号安全。03新知讲解声纹识别声纹识别的挑战声纹识别的难点在于说话人的声音会因环境、情感、语速等多种因素而变化。这种个体本身的变化性有时甚至大于不同人之间的差异,导致识别很困难。03新知讲解声纹识别的运用智能播放智能家居可以通过识别家庭成员的身份,提供个性化的服务。比如智能音箱检测到“播放歌曲”的指令是由一个孩子发出的,它将倾向于播放儿歌。03新知讲解声纹识别的运用侦破案件通过声音比对,可以筛查嫌疑犯,缩小追踪范围,加速案件侦破。03新知讲解声音事件检测声音事件检测的概念声音事件检测能够在复杂的声音环境中识别并分离出不同的声音事件,类似于机器视觉中的物体识别。03新知讲解声音事件检测索尼智能音频分析系统,检测环境声音事件,用于安防监控。03新知讲解声音事件检测字节跳动音频理解技术 ,在内容审核等场景检测特定声音事件。03新知讲解声音事件检测的挑战不同声源的声音会互相叠加,增加了检测的复杂性。与机器视觉中的物体识别相似,但声音的叠加性使得问题更加复杂。03新知讲解声音事件检测的应用实际应用:1.生活场景监测,如家居环境下是否有摔倒、呼救、哭泣等。2.在安防系统中,检测并识别可疑声音事件,如打斗、爆炸。3.在工业生产中,检测可能的故障(如变压器、铁轨等)。4.与摄像头联动,可以更有效捕获场景信息。03新知讲解机器在声纹识别等任务已超人类,但识别情绪、“鸡尾酒会” 场景聚焦特定说话者等任务仍不及人类,不过技术进步或让机器听觉未来全面超越人类 。总结03新知讲解机器听觉的未来发展超越人耳的机器听觉更精确地感知周围环境,在更复杂的环境中处理声音信号,在高度混杂场景中,获得比人更高的辨识能力和处理能力04课堂练习一、判断题。1.声纹识别技术已成熟,可作为司法定罪的主要证据。( )2.声音事件检测与机器视觉中的物体识别原理类似,都是从场景中检测目标。( )3.早期语音识别发展困难的主要原因是缺乏深度神经网络技术。( )4.苹果 Siri 仅支持英语语音指令,无法识别中文等其他语言。( )×√×√04课堂练习二、选择题1.下列哪项技术属于语音识别的前沿成果?( )A. 索尼智能音频分析系统 B. OpenAI 的 WhisperC. 声智科技声纹身份认证系统 D. 腾讯云智聆声纹服务2.声纹识别在智能家居中的典型应用是?( )A. 根据家庭成员声音播放个性化内容 B. 自动调节室内温度C. 识别环境噪音并启动降噪模式 D. 通过手势控制家电开关3.声音事件检测的主要技术难点在于?( )A. 声音信号与图像信号的转换效率低 B. 不同声源声音叠加形成复杂混合信号C. 硬件麦克风的采样率不足 D. 无法识别非人类声音(如动物叫声)ABB04课堂练习三、填空题1.语音识别的任务是从声音信号中提取__________的内容。。2.声纹识别通过提取声音中独特的__________特性来识别发音人身份。3.声音事件检测需要从__________的声音序列中提取不同事件(如说话、音乐、汽车声)。4.科大讯飞输入法应用__________技术实现高效语音转文字,覆盖多种场景输入。发音说话人多种声源叠加语音识别05拓展延伸声纹识别的生物学原理。 声纹识别的核心在于每个人的发声器官(如声带、鼻腔)结构独特,如同 “声音指纹”。成年后声带长度稳定(男性约 17-23mm,女性约 12-17mm),配合口腔肌肉运动模式,形成特定的频谱特征。05拓展延伸声音事件检测可用于生态保护,如通过部署野外声学传感器,识别濒危动物叫声(如蓝鲸低频鸣唱、雨林鸟类啼鸣),结合 AI 分析种群数量与活动范围。05拓展延伸伦理边界:AI 听觉技术的隐私挑战。声纹识别若用于公共场所监控,可能引发 “声音窃听” 争议。例如,某些智能音箱在待机时持续采集环境声音,存在数据滥用风险;司法领域中,声纹证据若与其他生物特征(如 DNA)结合,可能导致过度定罪。欧盟《通用数据保护条例》(GDPR)已将声纹列为 “特殊类别个人数据”,要求额外保护。06板书设计1语音识别2声纹识别3声音事件检测4完成课堂练习5进行相关知识拓展12345机器的耳朵08课后作业1、请简述语音识别、声纹识别和声音事件检测的核心区别。语音识别:从声音信号中提取发音内容(如将语音转写为文字),关注 “说了什么”。声纹识别:通过声音特征识别发音人身份,关注 “谁在说”。声音事件检测:从混合声音中识别不同类型的声音事件(如说话、汽车鸣笛、音乐),关注 “发生了什么声音”。https://www.21cnjy.com/recruitment/home/fine 展开更多...... 收起↑ 资源列表 【清华版】人工智能通识(中学)第一单元 第4课《机器的耳朵》 课件.pptx 机器的耳朵.mp4