第一单元第5课《机器的嘴巴》课件+素材 -清华大学版人工智能通识（初中）

资源简介

(共35张PPT)
第一单元第5课
机器的嘴巴
清华版（中学）
通
1
学习目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
教学目标
（1）了解语音合成技术的原理及其发展历程。
（2）理解现代语音合成技术的主要方法。
（3）探讨语音合成技术的风险及其社会影响。
02
新知导入
02
新知导入
说一说语音合成技术在我们日常生活中的应用
清华大学东南门
航班已到达！
客服机器人
您的菜到了，祝您用餐愉快！
地图导航
机场广播
绘本阅读机器人
送餐机器人
地图导航
机场广播
02
新知导入
早期的机械发声机器
1769年，匈牙利发明家Wolfgang von Kempelen依据人类的发声机理，制作了一台机械发声器，这是让机器开口说话的早期尝试。
Kempelen发音器的复现模型
02
新知导入
早期的机械发声机器
Kempelen发音器的原理：皮质的风箱相当于人的肺，木质的空箱里面的有一个阀门，相当于声道。挤压风箱，气流冲过阀门进入空箱，即可模拟人类发音。在操作时，通过调整阀门处的孔洞，即可模仿不同的发音。
02
新知讲解
声码器:现代语音学的开端
1939年,贝尔实验室的科学家荷马·达德利发明了声码器,标志着现代语音合成技术和现代语音学的开端。达德利(Homer Dudley)发明的声码器是首次基于计算方法，用电路实现的发声装置。
02
新知讲解
声码器:现代语音学的开端
1939年,基于声码器原理VoCoder发声器在纽约世界博览会上展出,引起轰动。操作人员通过键盘控制发音内容,用脚踏板调整音高,实现了让人震撼的连续发音效果。
02
新知讲解
现代语音合成技术
早期的语音合成器完全基于达德利的声码器,它的发音过程是由计算机自动控制而非人为控制。
合成步骤：它先将句子拆分成发音单元,再为每个发音单元计算出声码器的参数(包括声带振动的频率和口鼻传递声音的特性),最后再交由声码器合成出声音。
02
新知讲解
现代语音合成技术
早期语音合成技术产品的特点
这种合成方法结构紧凑,声音质量也比较清晰,代表产品是DEC公司的DECtalk DTC01。这种发音有明显的机械感,常用于街机游戏。著名科学家霍金的轮椅也曾长期使用这种发音技术。
02
新知讲解
现代语音合成技术
语音拼接合成法
这种方法预先录制好一个覆盖各个发音单元的语音库，合成时从这些语料库中选择合适的片段拼接起来。因为是事先录好的声音，听起来更加自然。
02
新知讲解
现代语音合成技术
语音拼接合成技术产品的特点
拼接合成法需要存储大量语料，占用较多存储空间。另外，因为语料是固定的，合成系统只能发出固定的声音，不够灵活。
02
新知讲解
现代语音合成技术
现代语音转换技术
除了能从文本合成声音,目前的人工智能技术还可以对声音进行转换，这一转换技术,是通过一个神经网络提取发音内容,去掉人物A的发音特征,再经过另一个神经网络,加入人物B的发音特征,最终生成人物B的语音。
AI孙燕姿《好汉歌》
03
新知讲解
语音合成的风险
欺诈风险
合成语音可能被不法分子用于冒充他人诈骗、伪造司法证据、骗过声纹身份验证系统恶意闯入。
03
新知讲解
语音合成的风险
版权风险
以 “AI 孙燕姿” 为例，AI 合成音色歌曲的版权归属（原版权人、孙燕姿、AI 制作方）尚无定论。
03
新知讲解
机器语音合成技术经多年发展，早期靠机械模拟发声，难生成连贯可辨声音；进入计算机时代，借发音计算模型与声码器，机器能发清晰连贯声但有机械感；如今受益于语音数据积累和神经网络学习，可精细模拟人声，自然逼真，可以说“能听会说” 的机器已走进生活。
总结
03
新知讲解
爱思考
语音合成的便利
信息传播：新闻客户端、有声书平台等借技术，把文字内容转化为语音，方便用户在开车、运动等场景下，用 “听” 获取资讯、阅读书籍，拓宽信息接收渠道，提升获取效率。
03
新知讲解
爱思考
语音合成的便利
交通出行：导航软件实时语音播报路况、路线，司机不用分心看屏幕，保障驾驶安全，优化出行体验。
03
新知讲解
爱思考
语音合成的便利
教育教学：语言学习 App 用技术生成标准发音，辅助学习者纠音、模仿；教学课件添加语音讲解，让知识传递更生动，适配不同学习节奏。
04
课堂练习
一、判断题。
1.早期机械发声器可以连贯清晰地模拟人类语言。（）
2.声码器的发明标志着现代语音合成技术的开端。（）
3.基于神经网络的语音合成技术无法模拟人类语音的自然韵律。（）
4.“AI 孙燕姿” 歌曲的版权明确归属于原版权人，不存在争议。（ )
×
√
×
×
04
课堂练习
二、选择题
1.1939 年，贝尔实验室的科学家荷马达德利发明了什么设备，标志着现代语音合成技术的开端？( )
A. 机械发声器 B. 声码器 C. DECTalk DTC01 D. 智能音箱
2.下列哪项属于现代语音合成技术中基于神经网络的应用？( )
A. 早期机械发声器模拟人类发音 B. 导航软件自然流畅的语音播报
C. 基于声码器的 DECTalk 语音合成器 D. 1939 年展出的 Voder 发声器
3.“AI 孙燕姿” 用孙燕姿音色翻唱歌曲引发的主要争议是？( )
A. 技术原理不明确 B. 版权归属问题
C. 音质不够自然 D. 声纹识别错误
B
B
B
04
课堂练习
三、填空题
1.1769 年，匈牙利发明家制作了模拟人类发声的机械发声器。
2.现代语音合成技术中，的应用使得语音合成效果更加自然流畅，如 “AI 孙燕姿” 的音色转换。
3.基于声码器原理的发声器于 1939 年在纽约世界博览会展出，通过键盘和脚踏板控制发音。
沃尔夫冈冯肯佩伦
大规模神经网络
Voder
05
拓展了解
人对机器发声的渴望——培根的铜头
the brazen head at brasenose college, oxford
传说中世纪时期英国的罗杰·培根就造了一个会说话的铜头，可以回答各种问题，并预言未来。
然而，铜头只能在特定的时间段内说话，所以培根和他的助手必须时刻警惕，等待它发声。在铜头终于准备发声时，培根的助手由于疲惫而打盹，错过了铜头的预言。
铜头在说出一句简短的话后突然破裂，从而使培根失去了获得无限知识的机会。
03
拓展了解
讯飞配音，依托科大讯飞技术，支持多语种、多风格语音合成，可调节音量、语速、语调，插入换气等标记优化韵律。
03
拓展了解
AI 配音专家，免费开源的文字转语音软件，兼容 Windows 和 macOS 系统，支持文本转 WAV、MP3 格式语音文件，适合批量处理，不过初期安装配置相对繁琐。
03
拓展了解
Synthesia，基于 AI 的语音合成工具，生成语音自然，支持多音色，可用于视频配音、音频制作、自动化客服场景，满足不同内容创作对语音的需求。
03
拓展了解
腾讯云智能客服，凭腾讯 NLP 技术，适配电话及全渠道，会话分配与工单完善，主攻电商金融。
03
拓展了解
华为云智能客服，自研框架，NLP 准、适配复杂环境，全渠道 + 工单流转，适配政务金融。
03
拓展了解
speechify ，AI 文本转语音工具，多平台可用，声音库丰富，能快速生成自然流畅、带情感的虚拟角色语音。
03
拓展了解
海螺国际版，提供多种音频模型，支持音色情感、节奏调节，可创建专属音色，满足虚拟角色语音个性化需求。
06
板书设计
1
语音合成技术的原理及其发展
2
现代语音合成技术的主要方法
3
语音合成技术的风险及其社会影响
4
完成课堂练习
5
进行相关知识拓展
1
2
3
4
5
机器的嘴巴
08
课后作业
简述语音合成技术从早期到现代的主要发展阶段。
早期机械发声阶段（1769 年）：匈牙利人肯佩伦制作机械发声器，只能发出简单、模糊的声音，无法连贯清晰发音。
声码器开启现代阶段（1939 年）：贝尔实验室发明声码器，基于此原理的 Voder 发声器在纽约世博会展出。
基于声码器的计算机合成阶段：早期语音合成器通过拆分句子、计算参数合成语音（如 DECTalk），但发音有机械感。
神经网络合成阶段：利用大规模神经网络实现高度逼真的语音合成，如导航语音、AI 歌手音色转换等。
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

请用微信扫码

第一单元 第5课《机器的嘴巴》 课件+素材 -清华大学版 人工智能通识（初中）

第一单元 第5课《机器的嘴巴》 课件+素材 -清华大学版 人工智能通识（初中）

第一单元第5课《机器的嘴巴》课件+素材 -清华大学版人工智能通识（初中）

第一单元第5课《机器的嘴巴》课件+素材 -清华大学版人工智能通识（初中）