华为云语音语义创新Lab论文被人工智能顶级会议IJCAI2022接收

华为云语音语义创新Lab论文被人工智能顶级会议IJCAI2022接收

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

       2022年4月21日,人工智能领域国际顶级学术会议IJCAI 2022(THE 31ST INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE)公布论文入选名单,华为云语音语义创新Lab联合苏州大学的研究者们撰写的信息抽取论文《Efficient Document-level Event Extraction via Pseudo-Trigger-aware Pruned Complete Graph》通过层层审核后被接收。 IJCAI是人工智能的顶级会议,录用十分严格,根据官方评选结果,今年的IJCAI仅有15%的投稿论文被接收。

       在本次录取的工作中,研究者们主要围绕事件抽取进行研究。事件抽取的目标是利用给定的本文填充事件表格。文档级的事件抽取,区别于句子级的事件抽取,有着两个独特的难点:1. 实体要素分布在不同的句子中;2. 通常不提供实体触发词。为了解决这些问题,之前的研究主要集中在以自回归的方式生成事件要素链,因此在训练和推理速度上都往往缺少效率。与这些方法不同,如下图一,来自苏州大学和华为云的研究者们提出了一个轻量级的模型PTPCG(Pseudo-Trigger-aware Pruned Complete Graph,伪触发词感知的剪枝完全图)。PTPCG通过自动选取伪触发词构建了一个剪枝完全图,并设计了一个非自回归解码的算法上在图上进行事件要素组合抽取。

       利用这种非自回归解码的方式,本文提出的PTPCG在达到与之前论文同等结果的情况下,仅需3.6%的GPU训练消耗量(即从4张V100显卡训练一周减少至仅需单卡V100训练一天),并且提高了8.5倍的推理速度。本文介绍的工作让文档级事件抽取的门槛大大降低,为后续开发者们研究文档级事件抽取做出了坚实的贡献。同时,本文代码也已经开源,欢迎开发者们尝试。

       不止在信息抽取方面,华为云语音语义创新Lab秉承开放创新、勇于探索、持续突破关键技术的精神,面向行业客户提供领先的语音语义AI能力,结合大量行业知识,推出知识计算等行业解决方案,打造业界一流的知识计算竞争力。截至目前,已在政务、金融、石油等多个行业进行了落地和实践,帮助客户实现AI落地与智能升级。

       相关论文请点击链接:https://arxiv.org/pdf/2112.06013.pdf

       相关代码请点击链接:https://github.com/Spico197/DocEE