华为云阿拉伯语预训练语言模型包揽阿拉伯语语言理解榜单ALUE前两名

基于在自然语言理解和阿拉伯语NLP的沉淀,华为云语音语义创新Lab联合华为诺亚实验室,共同构建了阿拉伯语预训练语言模型JABERSABER。在业内权威的阿拉伯语预训练语言模型榜单ALUE中,SABERJABER分获第一名和第二名的成绩,相比榜单中第三名的阿语预训练语言模型,整体评分分别提升10.26.6分。


近年来,预训练语言模型成为自然语言处理研究领域中的重点方向,它对提升诸如问答、命名实体识别等下游NLP任务起着至关重要的问题。由于语法复杂、方言体系庞大等特点,已有的开源阿拉伯语预训练语言模型通常面临着诸多问题。华为云语音语义创新Lab与华为诺亚实验室将阿语特性融入预训练语言模型的训练过程中,大幅提升模型对阿语的理解能力,在阿语NLP下游任务中都获得了不错的表现。

         目前,我们已经将阿拉伯语预训练语言模型JABER所涉及的技术通过论文形式进行了公开,欢迎感兴趣的同仁联系我们,共同探索阿语预训练语言模型技术。


随时获取华为云AI最新动态,欢迎关注华为云AI公众号:

B8483785-C43D-4374-9026-618F8EBE3597.png