第一单元 第5课《机器的嘴巴》 课件+素材 -清华大学版 人工智能通识(初中)

资源下载
  1. 二一教育资源

第一单元 第5课《机器的嘴巴》 课件+素材 -清华大学版 人工智能通识(初中)

资源简介

(共35张PPT)
第一单元 第5课
机器的嘴巴
清华版(中学)

1
学习目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
教学目标
(1)了解语音合成技术的原理及其发展历程。
(2)理解现代语音合成技术的主要方法。
(3)探讨语音合成技术的风险及其社会影响。
02
新知导入
02
新知导入
说一说语音合成技术在我们日常生活中的应用
清华大学东南门
航班已到达!
客服机器人
您的菜到了,祝您用餐愉快!
地图导航
机场广播
绘本阅读机器人
送餐机器人
地图导航
机场广播
02
新知导入
早期的机械发声机器
1769年,匈牙利发明家Wolfgang von Kempelen依据人类的发声机理,制作了一台机械发声器,这是让机器开口说话的早期尝试。
Kempelen发音器的复现模型
02
新知导入
早期的机械发声机器
Kempelen发音器的原理:皮质的风箱相当于人的肺,木质的空箱里面的有一个阀门,相当于声道。挤压风箱,气流冲过阀门进入空箱,即可模拟人类发音。在操作时,通过调整阀门处的孔洞,即可模仿不同的发音。
02
新知讲解
声码器:现代语音学的开端
1939年,贝尔实验室的科学家荷马·达德利发明了声码器,标志着现代语音合成技术和现代语音学的开端。达德利(Homer Dudley)发明的声码器是首次基于计算方法,用电路实现的发声装置。
02
新知讲解
声码器:现代语音学的开端
1939年,基于声码器原理VoCoder发声器在纽约世界博览会上展出,引起轰动。操作人员通过键盘控制发音内容,用脚踏板调整音高,实现了让人震撼的连续发音效果。
02
新知讲解
现代语音合成技术
早期的语音合成器完全基于达德利的声码器,它的发音过程是由计算机自动控制而非人为控制。
合成步骤:它先将句子拆分成发音单元,再为每个发音单元计算出声码器的参数(包括声带振动的频率和口鼻传递声音的特性),最后再交由声码器合成出声音。
02
新知讲解
现代语音合成技术
早期语音合成技术产品的特点
这种合成方法结构紧凑,声音质量也比较清晰,代表产品是DEC公司的DECtalk DTC01。这种发音有明显的机械感,常用于街机游戏。著名科学家霍金的轮椅也曾长期使用这种发音技术。
02
新知讲解
现代语音合成技术
语音拼接合成法
这种方法预先录制好一个覆盖各个发音单元的语音库,合成时从这些语料库中选择合适的片段拼接起来。因为是事先录好的声音,听起来更加自然。
02
新知讲解
现代语音合成技术
语音拼接合成技术产品的特点
拼接合成法需要存储大量语料,占用较多存储空间。另外,因为语料是固定的,合成系统只能发出固定的声音,不够灵活。
02
新知讲解
现代语音合成技术
现代语音转换技术
除了能从文本合成声音,目前的人工智能技术还可以对声音进行转换,这一转换技术,是通过一个神经网络提取发音内容,去掉人物A的发音特征,再经过另一个神经网络,加入人物B的发音特征,最终生成人物B的语音。
AI孙燕姿《好汉歌》
03
新知讲解
语音合成的风险
欺诈风险
合成语音可能被不法分子用于冒充他人诈骗、伪造司法证据、骗过声纹身份验证系统恶意闯入 。
03
新知讲解
语音合成的风险
版权风险
以 “AI 孙燕姿” 为例,AI 合成音色歌曲的版权归属(原版权人、孙燕姿、AI 制作方 )尚无定论 。
03
新知讲解
机器语音合成技术经多年发展,早期靠机械模拟发声,难生成连贯可辨声音;进入计算机时代,借发音计算模型与声码器,机器能发清晰连贯声但有机械感;如今受益于语音数据积累和神经网络学习,可精细模拟人声,自然逼真,可以说“能听会说” 的机器已走进生活 。
总结
03
新知讲解
爱思考
语音合成的便利
信息传播:新闻客户端、有声书平台等借技术,把文字内容转化为语音,方便用户在开车、运动等场景下,用 “听” 获取资讯、阅读书籍,拓宽信息接收渠道,提升获取效率。
03
新知讲解
爱思考
语音合成的便利
交通出行:导航软件实时语音播报路况、路线,司机不用分心看屏幕,保障驾驶安全,优化出行体验。
03
新知讲解
爱思考
语音合成的便利
教育教学:语言学习 App 用技术生成标准发音,辅助学习者纠音、模仿;教学课件添加语音讲解,让知识传递更生动,适配不同学习节奏。
04
课堂练习
一、判断题。
1.早期机械发声器可以连贯清晰地模拟人类语言。 ( )
2.声码器的发明标志着现代语音合成技术的开端。 ( )
3.基于神经网络的语音合成技术无法模拟人类语音的自然韵律。 ( )
4.“AI 孙燕姿” 歌曲的版权明确归属于原版权人,不存在争议。( )
×

×
×
04
课堂练习
二、选择题
1.1939 年,贝尔实验室的科学家荷马 达德利发明了什么设备,标志着现代语音合成技术的开端?( )
A. 机械发声器 B. 声码器 C. DECTalk DTC01 D. 智能音箱
2.下列哪项属于现代语音合成技术中基于神经网络的应用?( )
A. 早期机械发声器模拟人类发音 B. 导航软件自然流畅的语音播报
C. 基于声码器的 DECTalk 语音合成器 D. 1939 年展出的 Voder 发声器
3.“AI 孙燕姿” 用孙燕姿音色翻唱歌曲引发的主要争议是?( )
A. 技术原理不明确 B. 版权归属问题
C. 音质不够自然 D. 声纹识别错误
B
B
B
04
课堂练习
三、填空题
1.1769 年,匈牙利发明家 制作了模拟人类发声的机械发声器。
2.现代语音合成技术中, 的应用使得语音合成效果更加自然流畅,如 “AI 孙燕姿” 的音色转换。
3.基于声码器原理的 发声器于 1939 年在纽约世界博览会展出,通过键盘和脚踏板控制发音。
沃尔夫冈 冯 肯佩伦
大规模神经网络
Voder
05
拓展了解
人对机器发声的渴望——培根的铜头
the brazen head at brasenose college, oxford
传说中世纪时期英国的罗杰·培根就造了一个会说话的铜头,可以回答各种问题,并预言未来。
然而,铜头只能在特定的时间段内说话,所以培根和他的助手必须时刻警惕,等待它发声。在铜头终于准备发声时,培根的助手由于疲惫而打盹,错过了铜头的预言。
铜头在说出一句简短的话后突然破裂,从而使培根失去了获得无限知识的机会。
03
拓展了解
讯飞配音,依托科大讯飞技术,支持多语种、多风格语音合成,可调节音量、语速、语调,插入换气等标记优化韵律。
03
拓展了解
AI 配音专家 ,免费开源的文字转语音软件,兼容 Windows 和 macOS 系统,支持文本转 WAV、MP3 格式语音文件,适合批量处理,不过初期安装配置相对繁琐。
03
拓展了解
Synthesia,基于 AI 的语音合成工具,生成语音自然,支持多音色,可用于视频配音、音频制作、自动化客服场景,满足不同内容创作对语音的需求。
03
拓展了解
腾讯云智能客服,凭腾讯 NLP 技术,适配电话及全渠道,会话分配与工单完善,主攻电商金融 。
03
拓展了解
华为云智能客服,自研框架,NLP 准、适配复杂环境,全渠道 + 工单流转,适配政务金融 。
03
拓展了解
speechify ,AI 文本转语音工具,多平台可用,声音库丰富,能快速生成自然流畅、带情感的虚拟角色语音 。
03
拓展了解
海螺国际版 ,提供多种音频模型,支持音色情感、节奏调节,可创建专属音色,满足虚拟角色语音个性化需求 。
06
板书设计
1
语音合成技术的原理及其发展
2
现代语音合成技术的主要方法
3
语音合成技术的风险及其社会影响
4
完成课堂练习
5
进行相关知识拓展
1
2
3
4
5
机器的嘴巴
08
课后作业
简述语音合成技术从早期到现代的主要发展阶段。
早期机械发声阶段(1769 年): 匈牙利人肯佩伦制作机械发声器,只能发出简单、模糊的声音,无法连贯清晰发音。
声码器开启现代阶段(1939 年): 贝尔实验室发明声码器,基于此原理的 Voder 发声器在纽约世博会展出。
基于声码器的计算机合成阶段: 早期语音合成器通过拆分句子、计算参数合成语音(如 DECTalk),但发音有机械感。
神经网络合成阶段: 利用大规模神经网络实现高度逼真的语音合成,如导航语音、AI 歌手音色转换等。
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

资源列表