项目9:地址识别:让端侧机器人能写 课件(共24张PPT)-《智能语音应用开发》同步教学(电子工业版)

资源下载
  1. 二一教育资源

项目9:地址识别:让端侧机器人能写 课件(共24张PPT)-《智能语音应用开发》同步教学(电子工业版)

资源简介

(共24张PPT)
项目9
地址识别:让端侧机器人能写
项目背景
人们的生活中离不开网上购物。在进行快递下单时,由于下单量大,地址各式各样等原因,造成平台识别地址信息不全等问题,导致快递发货和处理错误,造成严重的人员消耗。因此,如何提高快递下单的效率及保证用户填写地址时的体验,是目前迫切需要解决的问题。
随着人工智能的发展,自然语言处理在很多App中都有实际应用的场景,其中,地址识别是命名实体识别中的应用,是自然语言处理文本分类的应用之一,它能够解析并精准提取快递单据中的文本信息,从而标准、规范地输出结构化信息,包含姓名、电话、地址,帮助快递或电商企业提高单据处理效率。本项目将使用目前主流的AI开放平台,通过人工智能技术解决上述问题。
教学目标
(1)了解命名实体识别的概念。
(2)了解中文命名实体识别的发展。
(3)熟悉中文命名实体识别的应用场景。
(4)掌握中文命名实体识别的评价方法。
(5)能够理解中文命名实体识别程序的逻辑。
(6)掌握中文命名实体识别接口的调用方法。
项目分析
(1)学习命名实体识别的概念及中文命名实体识别的过程和方法,了解中文命名实体识别。
(2)学习中文命名实体识别的性能评价方法。
(3)在百度AI开放平台上创建语音识别应用。
(4)创建语音识别、自然语言客户端,编写中文命名实体识别程序,实现中文命名实体识别。
(5)使用中文命名实体识别的评价方法,测试地址识别效果。
知识准备
知识点1:什么是命名实体识别
命名实体识别又被称为“专名识别”,用于识别文本中具有特定意义的实体,其中,实体包括人名、地名、专有名词、机构名等。
命名实体识别的任务是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。而地址识别是在命名实体识别的基础上的实际应用。
知识点2:中文命名实体识别的过程
1.BIO标注方法
在BIO(B-Begin,I-Inside,O-Outside)标注方法中,B表示实体词的开始位置,I表示实体词的非开始位置,O表示非实体词。通常一个实体的具体表示为:B/I-XXX,其中B/I后面跟实体的类型,非实体用O表示。
2.BIOES标注方法
BIOES标注方法是对BIO方法的扩展。其中,B表示实体开头,I表示实体内部,O表示非实体,E表示实体结尾,S表示该实体是由单个字构成的。
知识点3:中文命名实体识别的方法
1.基于规则的识别方法
基于规则的识别方法是最早出现在中文命名实体识别中的方法,它是在已有的规则体系之下构建的。
2.基于统计学的机器学习识别方法
21世纪初,随着机器学习在中文自然语言处理领域中的崛起,对中文命名实体识别的研究也转向统计学与机器学习相结合的方法。
3.基于深度学习的识别方法
目前,随着神经网络的迅速发展,基于深度学习的识别方法在人工智能的应用取得了重大的突破。
3种中文命名实体识别方法的代表技术及核心思想
知识点4:中文命名实体识别的性能评价
精准率:在命名实体识别中实际正确样本在预测正确样本中的占比。
召回率:在命名实体识别中预测正确样本在实际正确样本中的占比。
F1值:计算精确率和召回率的调和平均数,即加权调和平均数,通常a=1。
项目实施:
自然语言处理应用——地址识别
任务1 创建应用
步骤1:登录百度AI开放平台
步骤2:创建语音识别应用
获取并记录AppID、API Key、Secret Key、AppID2、API Key2和Secret Key2的信息
任务2 地址识别
步骤1:导入库函数
导入代码中需要的各种库函数。
步骤2:创建客户端
使用百度AI开放平台实现语音识别和地址识别,需要使用获取的百度AI云服务应用参数AppID、API Key、Secret Key来创建客户端,以实现相应功能。
(1)首先设定对话地址识别的AI云服务参数。
步骤2:创建客户端
(2)再设定语音识别的AI云服务参数。
步骤2:创建客户端
(3)创建两个客户端client、client2,client为地址识别的客户端,client2为语音识别的客户端。
步骤3:定义语音识别函数
首先定义音频读取函数,用于对录制的标准音频文件进行读取。
步骤3:定义语音识别函数
再定义语音识别函数,用于对录制的音频进行语音识别,将音频转换为文本。
步骤4:编写主函数
步骤4:编写主函数
任务3 结果分析
该任务将对地址识别程序进行测试,下面准备了10条不同类型的地址数据,通过运行程序,分别对10条地址数据进行识别(人名与电话号码均为虚构)。
地址识别性能评价

展开更多......

收起↑

资源预览