资源简介 (共32张PPT)项目6语音翻译:让端侧机器人会译项目背景文化的沟通与交流是人类文明绵延不绝、不断进步的重要条件,而语言是沟通与交流的重要媒介。网络技术的飞速发展为人类之间的交流拓展了更广阔的空间,人们对语言翻译的需求激增。人工智能技术的发展给计算机辅助翻译软件的创新带来了更多可能。本项目将使用目前主流的AI开放平台,通过人工智能技术提高翻译效率和翻译质量,为用户提供高质量的实时翻译服务。教学目标(1)了解语音翻译的基本原理。(2)了解语音翻译面临的主要挑战。(3)了解语音翻译的发展历程。(4)掌握语音翻译的评价方法。(5)能够理解翻译程序中函数的作用。(6)能够对语音翻译效果进行评估。项目分析(1)从机器翻译的原理、挑战及发展历程等方面,认识机器翻译。(2)学习机器翻译的评价方法。(3)在百度AI开放平台创建语音识别应用。(4)在百度AI开放平台创建机器翻译应用。(5)编写语音识别、文本翻译及语音翻译程序,实现机器翻译。(6)结合机器翻译的评价方法,测试机器翻译的效果。知识准备知识点1:什么是机器翻译机器翻译是指计算机自动将文字从一种自然语言(源语言)转换为含义相同的另一种自然语言(目标语言)的过程,机器翻译也被称为文本翻译。级联语音翻译系统与端到端语音翻译系统知识点2:机器翻译的发展历程1.基于规则的翻译翻译知识来自人类专家。基于规则的翻译就是通过人类语言学家来编写规则,将一个词翻译成另外一个词,一个成分翻译成另外一个成分,在句子中出现在什么位置,都用规则表示出来。2.基于统计的翻译基于统计的翻译系统对机器翻译进行了数学建模,可以在大数据的基础上进行训练。3.基于神经网络的翻译与基于统计的翻译相比,基于神经网络的翻译从模型上来说相对简单,它主要包含两部分,一个是编码器,另一个是解码器。3种翻译方法的优缺点对比知识点3:机器翻译的主要挑战1.译文选择2.词语顺序的调整因为文化及语言发展有差异,一些语言成分的顺序可能是完全相反的。3.数据稀疏目前的机器翻译技术基本是基于大数据的,在大量数据上训练,获得一个比较好的效果。知识点4:语音翻译的评价方法1.人工评价“信”用来衡量忠实度,即“信”衡量译文是不是忠实地反映了原文想要表达的意思。2.自动评价自动评价能够快速地反映出一个语音翻译的质量好还是不好,与人工评价相比,自动评价成本低、效率高。现在一般采用的方法是基于N-Gram(N元语法)的评价方法。项目实施:语音翻译应用——智能语音中英互译任务1 创建应用本项目首先使用语音识别技术将音频文件转换为文本,然后利用文本翻译技术将中文文本翻译成英文。所以本项目需要两个应用:语音识别应用和文本翻译应用。任务2 编写语音识别程序步骤1:配置基础环境步骤2:导入库函数实现语音翻译需要对数据进行编码和解码,以及调用百度API进行语音识别,导入相关的库函数有助于功能的实现。(1)requests:用于进行HTTP请求。(2)my_record:用于录制标准格式的音频数据,音频的标准格式如下。步骤3:创建客户端使用百度AI开放平台实现语音识别,需要使用获取的百度AI云服务应用参数AppID、API Key、Secret Key来创建客户端,以实现相应功能。首先设置语音识别的AI云服务参数。步骤4:定义音频读取函数步骤5:定义语音识别函数语音识别调用speech_recognition()语音识别函数进行语音识别,将语音识别的结果赋值给res。任务3 编写文本翻译程序步骤1:整体分析完成语音识别后,对识别出来的结果res进行语音翻译,再输出翻译的结果。步骤2:获取access_token由整体分析可知,获取请求URL需要先使用API Key和Secret Key获取access_token。获取access_token返回结果字典的访问方式提取信息运行代码获取access_token,并将access_token赋值给token步骤3:获取请求url由整体分析可知,请求URL由两部分组成:文本翻译的URL和access_token。步骤4:定义请求头由整体分析可知,请求头为字典,且该字典包含一个键值对。步骤5:设置请求参数由整体分析可知,请求参数为字典,且包含3个必需的参数步骤6:获取翻译结果文本翻译使用POST请求,通过前面的步骤,POST请求需要的3个参数都已经获取,接下来使用POST请求获取翻译的结果。使用POST请求得到翻译的结果r,调用json()方法将结果转换为JSON格式便于信息的提取,最后使用print()函数打印结果。提取原文和译文通过返回结果及字典的访问方式分别提取原文和译文,方便查看分别访问src和dst获取原文和译文任务4 测试语音翻译程序通过前面的任务,此时已经完整实现了语音翻译,接下来将对代码进行测试,并计算BLEU值。 展开更多...... 收起↑ 资源预览