项目6:语音翻译:让端侧机器人会译 课件(共32张PPT)-《智能语音应用开发》同步教学(电子工业版)

资源下载
  1. 二一教育资源

项目6:语音翻译:让端侧机器人会译 课件(共32张PPT)-《智能语音应用开发》同步教学(电子工业版)

资源简介

(共32张PPT)
项目6
语音翻译:让端侧机器人会译
项目背景
文化的沟通与交流是人类文明绵延不绝、不断进步的重要条件,而语言是沟通与交流的重要媒介。网络技术的飞速发展为人类之间的交流拓展了更广阔的空间,人们对语言翻译的需求激增。
人工智能技术的发展给计算机辅助翻译软件的创新带来了更多可能。本项目将使用目前主流的AI开放平台,通过人工智能技术提高翻译效率和翻译质量,为用户提供高质量的实时翻译服务。
教学目标
(1)了解语音翻译的基本原理。
(2)了解语音翻译面临的主要挑战。
(3)了解语音翻译的发展历程。
(4)掌握语音翻译的评价方法。
(5)能够理解翻译程序中函数的作用。
(6)能够对语音翻译效果进行评估。
项目分析
(1)从机器翻译的原理、挑战及发展历程等方面,认识机器翻译。
(2)学习机器翻译的评价方法。
(3)在百度AI开放平台创建语音识别应用。
(4)在百度AI开放平台创建机器翻译应用。
(5)编写语音识别、文本翻译及语音翻译程序,实现机器翻译。
(6)结合机器翻译的评价方法,测试机器翻译的效果。
知识准备
知识点1:什么是机器翻译
机器翻译是指计算机自动将文字从一种自然语言(源语言)转换为含义相同的另一种自然语言(目标语言)的过程,机器翻译也被称为文本翻译。
级联语音翻译系统与端到端语音翻译系统
知识点2:机器翻译的发展历程
1.基于规则的翻译
翻译知识来自人类专家。基于规则的翻译就是通过人类语言学家来编写规则,将一个词翻译成另外一个词,一个成分翻译成另外一个成分,在句子中出现在什么位置,都用规则表示出来。
2.基于统计的翻译
基于统计的翻译系统对机器翻译进行了数学建模,可以在大数据的基础上进行训练。
3.基于神经网络的翻译
与基于统计的翻译相比,基于神经网络的翻译从模型上来说相对简单,它主要包含两部分,一个是编码器,另一个是解码器。
3种翻译方法的优缺点对比
知识点3:机器翻译的主要挑战
1.译文选择
2.词语顺序的调整
因为文化及语言发展有差异,一些语言成分的顺序可能是完全相反的。
3.数据稀疏
目前的机器翻译技术基本是基于大数据的,在大量数据上训练,获得一个比较好的效果。
知识点4:语音翻译的评价方法
1.人工评价
“信”用来衡量忠实度,即“信”衡量译文是不是忠实地反映了原文想要表达的意思。
2.自动评价
自动评价能够快速地反映出一个语音翻译的质量好还是不好,与人工评价相比,自动评价成本低、效率高。现在一般采用的方法是基于N-Gram(N元语法)的评价方法。
项目实施:
语音翻译应用——智能语音中英互译
任务1 创建应用
本项目首先使用语音识别技术将音频文件转换为文本,然后利用文本翻译技术将中文文本翻译成英文。所以本项目需要两个应用:语音识别应用和文本翻译应用。
任务2 编写语音识别程序
步骤1:配置基础环境
步骤2:导入库函数
实现语音翻译需要对数据进行编码和解码,以及调用百度API进行语音识别,导入相关的库函数有助于功能的实现。
(1)requests:用于进行HTTP请求。
(2)my_record:用于录制标准格式的音频数据,音频的标准格式如下。
步骤3:创建客户端
使用百度AI开放平台实现语音识别,需要使用获取的百度AI云服务应用参数AppID、API Key、Secret Key来创建客户端,以实现相应功能。首先设置语音识别的AI云服务参数。
步骤4:定义音频读取函数
步骤5:定义语音识别函数
语音识别
调用speech_recognition()语音识别函数进行语音识别,将语音识别的结果赋值给res。
任务3 编写文本翻译程序
步骤1:整体分析
完成语音识别后,对识别出来的结果res进行语音翻译,再输出翻译的结果。
步骤2:获取access_token
由整体分析可知,获取请求URL需要先使用API Key和Secret Key获取access_token。
获取access_token
返回结果
字典的访问方式提取信息
运行代码获取access_token,并将access_token赋值给token
步骤3:获取请求url
由整体分析可知,请求URL由两部分组成:文本翻译的URL和access_token。
步骤4:定义请求头
由整体分析可知,请求头为字典,且该字典包含一个键值对。
步骤5:设置请求参数
由整体分析可知,请求参数为字典,且包含3个必需的参数
步骤6:获取翻译结果
文本翻译使用POST请求,通过前面的步骤,POST请求需要的3个参数都已经获取,接下来使用POST请求获取翻译的结果。
使用POST请求得到翻译的结果r,调用json()方法将结果转换为JSON格式便于信息的提取,最后使用print()函数打印结果。
提取原文和译文
通过返回结果及字典的访问方式分别提取原文和译文,方便查看
分别访问src和dst获取原文和译文
任务4 测试语音翻译程序
通过前面的任务,此时已经完整实现了语音翻译,接下来将对代码进行测试,并计算BLEU值。

展开更多......

收起↑

资源预览