知识图谱 KG-创建模型:训练模型框架介绍

时间:2023-11-01 16:18:25

训练模型框架介绍

KG服务提供不同类型的关系抽取模型,以应对用户不同的条件与需求。

KG服务当前提供以下训练模型框架供您自定义模型:

  • DGCNN是一个较为复杂的端到端关系抽取模型,它在使用BERT模型建模语言关系的基础上,利用DGCNN网络额外使用了文本的分词词性信息,这使得它对于待抽取实体的边界识别能力很强。但复杂的模型意味着更多的标注数据需求,推荐平均每类关系三元组标注数据在400以上,所有标注文本样本数量在8000以上。
  • MRC-BM-v2是一个非常简单的、基于BERT模型、端到端的关系抽取模型,它对于标注数据量的要求非常低,平均每个关系仅需要200组左右标注数据即可训练出一个较好(实测F1值在0.7左右)的模型,平均每个关系标注数据在2000左右模型训练效果达到一个峰值(实测F1值在0.8左右),数据量越多,质量越好,效果会越好。
  • MRC-BM是旧版本的模型,为兼容保留,新创建模型请使用MRC-BM-v2。
support.huaweicloud.com/usermanual-kg/kg_01_0024.html