华为云语音语义创新Lab夺得CCL中文AMR语义解析评测任务冠军

华为云语音语义创新Lab夺得CCL中文AMR语义解析评测任务冠军

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

        抽象语义表示(Abstract Meaning Representation, AMR)是一种领域无关的、通用的整句语义表示方法,它使用单根有向无环图来表示一个句子的语义结构。作为一种深层的语义表示方法,AMR能够有效挖掘句子的语义信息,并提升很多自然语言处理下游任务的性能,比如机器翻译、文本摘要、信息抽取等。和英文AMR相比,中文抽象语义表示(Chinese AMR, CAMR)增加了概念关系对齐信息,并针对中文特点增加了一些语义标签。


        本次CAMR评测比赛依托第二十一届中国计算语言学大会CCL-2022。CCL是中国中文信息学会(CIPS)的重要会议,是中国最大的自然语言处理学者和专家的社区。经过三十年的发展,CCL被广泛认为是最权威的,全国最具影响力、规模最大的NLP会议。华为云语音语义创新Lab和苏州大学组成的联合团队在“中文抽象语义表示解析”评测任务中获得第一名的佳绩。本次评测共有testa和testb两个测试数据集,并分为closed和open两个赛道,我们在两个赛道、两个测试集上均取得了第一名的成绩。详细的信息请查看评测网址:https://github.com/GoThereGit/Chinese-AMR

        CAMR评测任务的难点在于,AMR图中的概念节点和句子中词并不是一一对应的关系,有的概念节点由单个词组成,有的概念节点只由一个词当中的几个字组成,有的概念节点是由多个词组成,有的概念节点甚至并不存于句子中,例如下图中的节点“temporal-quantity”。AMR的这种特性决定了我们不能直接采用传统的基于图的方法解决。

       为了处理这个问题,我们尝试了一系列最新的自然语言处理技术,最终决定采用非自回归的方法首先生成AMR图中的概念节点,然后对这些节点进行边的建立、从而生成最终的AMR语义图。为了进一步提升模型的性能,我们还采用了多图聚合的ensemble策略。在实验中,我们还发现句子的句法结构能够有效提升CAMR的性能。结合这些先进的技术,我们最终取得了评测任务第一名的成绩。



         语义分析是自然语言处理的一个核心任务,也是人工智能的一个重要的组成部分。华为云语音语义创新Lab在人工智能语音语义领域深耕技术,接连夺得包括DiggScience科学数据挖掘,NLPCC预训练模型,CCF BDCI金融实体情感分析,WSDM网络搜索与数据挖掘在内的多项国际国内顶赛冠军。凭借先进的NLP技术,华为云提供了多个高效的场景应用、极大地提升了客户的工作效率。


随时获取华为云AI最新动态,欢迎关注华为云AI公众号:

随时获取华为云AI最新动态,欢迎关注华为云AI公众号:

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理