资源简介 (共24张PPT)项目9地址识别:让端侧机器人能写项目背景人们的生活中离不开网上购物。在进行快递下单时,由于下单量大,地址各式各样等原因,造成平台识别地址信息不全等问题,导致快递发货和处理错误,造成严重的人员消耗。因此,如何提高快递下单的效率及保证用户填写地址时的体验,是目前迫切需要解决的问题。随着人工智能的发展,自然语言处理在很多App中都有实际应用的场景,其中,地址识别是命名实体识别中的应用,是自然语言处理文本分类的应用之一,它能够解析并精准提取快递单据中的文本信息,从而标准、规范地输出结构化信息,包含姓名、电话、地址,帮助快递或电商企业提高单据处理效率。本项目将使用目前主流的AI开放平台,通过人工智能技术解决上述问题。教学目标(1)了解命名实体识别的概念。(2)了解中文命名实体识别的发展。(3)熟悉中文命名实体识别的应用场景。(4)掌握中文命名实体识别的评价方法。(5)能够理解中文命名实体识别程序的逻辑。(6)掌握中文命名实体识别接口的调用方法。项目分析(1)学习命名实体识别的概念及中文命名实体识别的过程和方法,了解中文命名实体识别。(2)学习中文命名实体识别的性能评价方法。(3)在百度AI开放平台上创建语音识别应用。(4)创建语音识别、自然语言客户端,编写中文命名实体识别程序,实现中文命名实体识别。(5)使用中文命名实体识别的评价方法,测试地址识别效果。知识准备知识点1:什么是命名实体识别命名实体识别又被称为“专名识别”,用于识别文本中具有特定意义的实体,其中,实体包括人名、地名、专有名词、机构名等。命名实体识别的任务是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。而地址识别是在命名实体识别的基础上的实际应用。知识点2:中文命名实体识别的过程1.BIO标注方法在BIO(B-Begin,I-Inside,O-Outside)标注方法中,B表示实体词的开始位置,I表示实体词的非开始位置,O表示非实体词。通常一个实体的具体表示为:B/I-XXX,其中B/I后面跟实体的类型,非实体用O表示。2.BIOES标注方法BIOES标注方法是对BIO方法的扩展。其中,B表示实体开头,I表示实体内部,O表示非实体,E表示实体结尾,S表示该实体是由单个字构成的。知识点3:中文命名实体识别的方法1.基于规则的识别方法基于规则的识别方法是最早出现在中文命名实体识别中的方法,它是在已有的规则体系之下构建的。2.基于统计学的机器学习识别方法21世纪初,随着机器学习在中文自然语言处理领域中的崛起,对中文命名实体识别的研究也转向统计学与机器学习相结合的方法。3.基于深度学习的识别方法目前,随着神经网络的迅速发展,基于深度学习的识别方法在人工智能的应用取得了重大的突破。3种中文命名实体识别方法的代表技术及核心思想知识点4:中文命名实体识别的性能评价精准率:在命名实体识别中实际正确样本在预测正确样本中的占比。召回率:在命名实体识别中预测正确样本在实际正确样本中的占比。F1值:计算精确率和召回率的调和平均数,即加权调和平均数,通常a=1。项目实施:自然语言处理应用——地址识别任务1 创建应用步骤1:登录百度AI开放平台步骤2:创建语音识别应用获取并记录AppID、API Key、Secret Key、AppID2、API Key2和Secret Key2的信息任务2 地址识别步骤1:导入库函数导入代码中需要的各种库函数。步骤2:创建客户端使用百度AI开放平台实现语音识别和地址识别,需要使用获取的百度AI云服务应用参数AppID、API Key、Secret Key来创建客户端,以实现相应功能。(1)首先设定对话地址识别的AI云服务参数。步骤2:创建客户端(2)再设定语音识别的AI云服务参数。步骤2:创建客户端(3)创建两个客户端client、client2,client为地址识别的客户端,client2为语音识别的客户端。步骤3:定义语音识别函数首先定义音频读取函数,用于对录制的标准音频文件进行读取。步骤3:定义语音识别函数再定义语音识别函数,用于对录制的音频进行语音识别,将音频转换为文本。步骤4:编写主函数步骤4:编写主函数任务3 结果分析该任务将对地址识别程序进行测试,下面准备了10条不同类型的地址数据,通过运行程序,分别对10条地址数据进行识别(人名与电话号码均为虚构)。地址识别性能评价 展开更多...... 收起↑ 资源预览