云服务器内容精选
-
操作场景 图引擎服务在创建图完成后可以导入图数据,或者当您需要新增图数据时,可以利用“导入”功能进行增量导入。 当前仅支持 1.1.8 以上版本的图的增量导入功能。 为防止系统重启时,不能正常恢复导入图数据,建议在使用图期间,不要删除存储在OBS中的数据。 数据列的分隔符默认为逗号,暂不支持自定义。 导入目录下的单文件或者导入的单文件大小不能超过5GB,如果超过5GB,则会导入失败,建议把文件拆成小于5GB的多个文件后再导入。 单次导入的文件总大小(包括点、边数据集)不能超过可用内存的1/5。可用内存参考“运维监控面板”的“节点监控”中名称后缀为ges-dn-1-1和ges-dn-2-1节点可用内存(可以把鼠标悬浮在内存使用率上弹出)的最小值。
-
创建图谱简介 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、 CS V、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自定义信息抽取模型并使用自定义抽取模型创建知识图谱的流程,帮助您快速熟悉知识图谱自定义信息抽取模型创建过程和使用非结构化数据创建图谱的过程。步骤如下: 创建信息抽取模型:以在ModelArts控制台上标注数据为例,介绍信息抽取模型的构建流程。 使用自定义抽取模型创建图谱:介绍通过自定义的信息抽取模型创建知识图谱的流程。 父主题: 非结构化数据创建图谱
-
配置实体唯一标识字段 在创建图谱过程中,在依次完成数据源配置、本体选择操作后,配置信息抽取时配置实体唯一标识字段。 登录KG服务管理控制台,默认进入“我的图谱”页面,单击,进入“新建图谱”页面。 在“新建图谱”页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框。 单击“增加”,在“数据类别”中填写新的数据类别,“抽取项名称”自动填充“identifier”,在“抽取函数”文本框中填写实体唯一标识字段,并填写信息抽取的其他信息。 详细操作请参见配置信息抽取。
-
实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。 "{ "entity_type":"Person", "中文名":"元鲜", "国籍":"中国([link]@中国:/film.kg.huawei.com/中国/1122445)", "职业":"演员", "出生日期":"1988年7月21日", "url":"/film.kg.huawei.com/元鲜"}"