资源简介 (共35张PPT)第一单元 第5课机器的嘴巴清华版(中学)通1学习目标3新知讲解5拓展延伸7板书设计2新知导入4课堂练习6课堂总结课后作业801教学目标(1)了解语音合成技术的原理及其发展历程。(2)理解现代语音合成技术的主要方法。(3)探讨语音合成技术的风险及其社会影响。02新知导入02新知导入说一说语音合成技术在我们日常生活中的应用清华大学东南门航班已到达!客服机器人您的菜到了,祝您用餐愉快!地图导航机场广播绘本阅读机器人送餐机器人地图导航机场广播02新知导入早期的机械发声机器1769年,匈牙利发明家Wolfgang von Kempelen依据人类的发声机理,制作了一台机械发声器,这是让机器开口说话的早期尝试。Kempelen发音器的复现模型02新知导入早期的机械发声机器Kempelen发音器的原理:皮质的风箱相当于人的肺,木质的空箱里面的有一个阀门,相当于声道。挤压风箱,气流冲过阀门进入空箱,即可模拟人类发音。在操作时,通过调整阀门处的孔洞,即可模仿不同的发音。02新知讲解声码器:现代语音学的开端1939年,贝尔实验室的科学家荷马·达德利发明了声码器,标志着现代语音合成技术和现代语音学的开端。达德利(Homer Dudley)发明的声码器是首次基于计算方法,用电路实现的发声装置。02新知讲解声码器:现代语音学的开端1939年,基于声码器原理VoCoder发声器在纽约世界博览会上展出,引起轰动。操作人员通过键盘控制发音内容,用脚踏板调整音高,实现了让人震撼的连续发音效果。02新知讲解现代语音合成技术早期的语音合成器完全基于达德利的声码器,它的发音过程是由计算机自动控制而非人为控制。合成步骤:它先将句子拆分成发音单元,再为每个发音单元计算出声码器的参数(包括声带振动的频率和口鼻传递声音的特性),最后再交由声码器合成出声音。02新知讲解现代语音合成技术早期语音合成技术产品的特点这种合成方法结构紧凑,声音质量也比较清晰,代表产品是DEC公司的DECtalk DTC01。这种发音有明显的机械感,常用于街机游戏。著名科学家霍金的轮椅也曾长期使用这种发音技术。02新知讲解现代语音合成技术语音拼接合成法这种方法预先录制好一个覆盖各个发音单元的语音库,合成时从这些语料库中选择合适的片段拼接起来。因为是事先录好的声音,听起来更加自然。02新知讲解现代语音合成技术语音拼接合成技术产品的特点拼接合成法需要存储大量语料,占用较多存储空间。另外,因为语料是固定的,合成系统只能发出固定的声音,不够灵活。02新知讲解现代语音合成技术现代语音转换技术除了能从文本合成声音,目前的人工智能技术还可以对声音进行转换,这一转换技术,是通过一个神经网络提取发音内容,去掉人物A的发音特征,再经过另一个神经网络,加入人物B的发音特征,最终生成人物B的语音。AI孙燕姿《好汉歌》03新知讲解语音合成的风险欺诈风险合成语音可能被不法分子用于冒充他人诈骗、伪造司法证据、骗过声纹身份验证系统恶意闯入 。03新知讲解语音合成的风险版权风险以 “AI 孙燕姿” 为例,AI 合成音色歌曲的版权归属(原版权人、孙燕姿、AI 制作方 )尚无定论 。03新知讲解机器语音合成技术经多年发展,早期靠机械模拟发声,难生成连贯可辨声音;进入计算机时代,借发音计算模型与声码器,机器能发清晰连贯声但有机械感;如今受益于语音数据积累和神经网络学习,可精细模拟人声,自然逼真,可以说“能听会说” 的机器已走进生活 。总结03新知讲解爱思考语音合成的便利信息传播:新闻客户端、有声书平台等借技术,把文字内容转化为语音,方便用户在开车、运动等场景下,用 “听” 获取资讯、阅读书籍,拓宽信息接收渠道,提升获取效率。03新知讲解爱思考语音合成的便利交通出行:导航软件实时语音播报路况、路线,司机不用分心看屏幕,保障驾驶安全,优化出行体验。03新知讲解爱思考语音合成的便利教育教学:语言学习 App 用技术生成标准发音,辅助学习者纠音、模仿;教学课件添加语音讲解,让知识传递更生动,适配不同学习节奏。04课堂练习一、判断题。1.早期机械发声器可以连贯清晰地模拟人类语言。 ( )2.声码器的发明标志着现代语音合成技术的开端。 ( )3.基于神经网络的语音合成技术无法模拟人类语音的自然韵律。 ( )4.“AI 孙燕姿” 歌曲的版权明确归属于原版权人,不存在争议。( )×√××04课堂练习二、选择题1.1939 年,贝尔实验室的科学家荷马 达德利发明了什么设备,标志着现代语音合成技术的开端?( )A. 机械发声器 B. 声码器 C. DECTalk DTC01 D. 智能音箱2.下列哪项属于现代语音合成技术中基于神经网络的应用?( )A. 早期机械发声器模拟人类发音 B. 导航软件自然流畅的语音播报C. 基于声码器的 DECTalk 语音合成器 D. 1939 年展出的 Voder 发声器3.“AI 孙燕姿” 用孙燕姿音色翻唱歌曲引发的主要争议是?( )A. 技术原理不明确 B. 版权归属问题C. 音质不够自然 D. 声纹识别错误BBB04课堂练习三、填空题1.1769 年,匈牙利发明家 制作了模拟人类发声的机械发声器。2.现代语音合成技术中, 的应用使得语音合成效果更加自然流畅,如 “AI 孙燕姿” 的音色转换。3.基于声码器原理的 发声器于 1939 年在纽约世界博览会展出,通过键盘和脚踏板控制发音。沃尔夫冈 冯 肯佩伦大规模神经网络Voder05拓展了解人对机器发声的渴望——培根的铜头the brazen head at brasenose college, oxford传说中世纪时期英国的罗杰·培根就造了一个会说话的铜头,可以回答各种问题,并预言未来。然而,铜头只能在特定的时间段内说话,所以培根和他的助手必须时刻警惕,等待它发声。在铜头终于准备发声时,培根的助手由于疲惫而打盹,错过了铜头的预言。铜头在说出一句简短的话后突然破裂,从而使培根失去了获得无限知识的机会。03拓展了解讯飞配音,依托科大讯飞技术,支持多语种、多风格语音合成,可调节音量、语速、语调,插入换气等标记优化韵律。03拓展了解AI 配音专家 ,免费开源的文字转语音软件,兼容 Windows 和 macOS 系统,支持文本转 WAV、MP3 格式语音文件,适合批量处理,不过初期安装配置相对繁琐。03拓展了解Synthesia,基于 AI 的语音合成工具,生成语音自然,支持多音色,可用于视频配音、音频制作、自动化客服场景,满足不同内容创作对语音的需求。03拓展了解腾讯云智能客服,凭腾讯 NLP 技术,适配电话及全渠道,会话分配与工单完善,主攻电商金融 。03拓展了解华为云智能客服,自研框架,NLP 准、适配复杂环境,全渠道 + 工单流转,适配政务金融 。03拓展了解speechify ,AI 文本转语音工具,多平台可用,声音库丰富,能快速生成自然流畅、带情感的虚拟角色语音 。03拓展了解海螺国际版 ,提供多种音频模型,支持音色情感、节奏调节,可创建专属音色,满足虚拟角色语音个性化需求 。06板书设计1语音合成技术的原理及其发展2现代语音合成技术的主要方法3语音合成技术的风险及其社会影响4完成课堂练习5进行相关知识拓展12345机器的嘴巴08课后作业简述语音合成技术从早期到现代的主要发展阶段。早期机械发声阶段(1769 年): 匈牙利人肯佩伦制作机械发声器,只能发出简单、模糊的声音,无法连贯清晰发音。声码器开启现代阶段(1939 年): 贝尔实验室发明声码器,基于此原理的 Voder 发声器在纽约世博会展出。基于声码器的计算机合成阶段: 早期语音合成器通过拆分句子、计算参数合成语音(如 DECTalk),但发音有机械感。神经网络合成阶段: 利用大规模神经网络实现高度逼真的语音合成,如导航语音、AI 歌手音色转换等。https://www.21cnjy.com/recruitment/home/fine 展开更多...... 收起↑ 资源列表 【清华版】人工智能通识(中学)第一单元 第5课《机器的嘴巴》 课件.pptx 语音合成技术原理.mp4