云服务器内容精选

  • 步骤8:配置知识融合 以如下融合条件为例: 对电影的属性“name”相似的数据进行知识融合判断,当属性“name”的相似度大于等于0.90,且属性“上映时间”的相似度大于等于0.90时,数据进行融合。对人物的属性“name”相似的数据进行知识融合判断,当属性“name”的相似度大于等于0.90,且属性“职业”的相似度大于等于0.90时,数据进行融合。相似度函数均为编辑距离函数“EditSim”。 展示如何配置知识融合。 在流水线构建页面,单击“知识融合”,页面下方弹出“知识融合”对话框,单击右侧按钮可以放大对话框。 在“知识融合”对话框,打开“知识融合”开关。 在左侧本体预览图中单击实体“电影”图标。 在实体“电影”对应的“融合标识符”栏单击,选择标识知识融合的本体属性“name”。 填写实体“电影”的属性配置项信息。 可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即可融合这两条数据。 本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图17所示。 单击“添加分组”,即可添加一组新的属性配置项。 单击“增加属性配置项”,即可在组内添加新的属性配置项。 实体配置完成后,单击“确定”。 图17 实体电影的知识融合属性 在左侧本体预览图中单击实体“人物”图标。 在实体“人物”对应的“融合标识符”栏单击,选择标识知识融合的本体属性“name”。 填写实体“人物”的属性配置项信息。 可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即可融合这两条数据。 本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图17所示。 单击“添加分组”,即可添加一组新的属性配置项。 单击“增加属性配置项”,即可在组内添加新的属性配置项。 实体配置完成后,单击“确定”。 图18 实体人物的知识融合属性 单击“保存”。
  • 步骤7:配置知识映射 以其中两条数据为例,知识与实体之间的映射关系如图14所示,展示如何配置知识映射。 图14 知识与实体的映射关系 在流水线构建页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。 在“知识映射”对话框下方,填写知识映射的相关信息。 单击实体“电影”对应的图标。 填写实体“电影”映射前的抽取项:“Film”。 填写映射到实体“电影”的抽取项,如图15和表4所示。 图15 实体电影的抽取项 表4 实体电影的抽取项 属性/关系名称 抽取项 name 中文名 票房 票房 上映时间 上映时间 电影:主演:人物 主演 电影:导演:人物 导演 单击实体“人物”对应的图标。 填写实体“人物”映射前的抽取项:“Person”。 填写映射到实体“人物”抽取项,如图16和表5所示。 图16 实体人物的抽取项 表5 实体人物的抽取项 属性 抽取项 name 中文名 国籍 国籍 职业 职业 出生日期 出生日期 单击“保存”,完成知识映射配置。
  • 步骤6:配置信息抽取 以两条数据为例,抽取信息前后的实体信息如图13所示,展示如何配置信息抽取。 图13 信息抽取 在流水线构建页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 在“信息抽取”对话框中,“抽取方式”默认为“结构化抽取”,“编辑方式”选择“交互界面”,关闭“默认抽取”开关。 在信息抽取页面填写信息抽取项,按表3填写。 表3 信息抽取项示例 实体类型 数据字段 字段函数 Person identifier ${url} 中文名 regexp_replace(${中文名}, '\(\[link\]@.*?:(/film.*?)\)', '') 国籍 regexp_replace(${国籍}, '\(\[link\]@.*?:(/film.*?)\)', '') 职业 ${职业} 出生日期 ${出生日期} url ${url} Film identifier ${url} 中文名 ${中文名} 票房 ${票房} 上映时间 ${上映时间} 导演 regexp_extract_all(${导演}, '\(\[link\]@.*?:(/film.*?)\)', 1) 主演 regexp_extract_all(${主演}, '\(\[link\]@.*?:(/film.*?)\)', 1) url ${url} 字段函数主要有三类,示例如下: ${职业} 直接引用“职业”字段的值,不做任何操作。 regexp_replace(${国籍}, '\(\[link\]@.*?:(/film.*?)\)', '') 将“国籍”字段中符合正则模式的“\(\[link\]@.*?:(/film.*?)\)”替换成空字符串,即删除符合这个pattern的字符串。例如从字段“中国([link]@中国:/film.kg.huawei.com/中国/1122445)”抽取出信息“中国”。 regexp_extract_all(${导演}, '\(\[link\]@.*?:(/film.*?)\)', 1) 抽取出导演字段中,与模式 “\(\[link\]@.*?:(/film.*?)\)” 匹配的数据值,返回的类型是一个列表。例如““导演”:“沈倨([link]@沈倨:/film.kg.huawei.com/沈倨)"”,抽取信息后为““导演”:“/film.kg.huawei.com/沈倨"”。 填写完“信息抽取项”,单击“确定”,完成信息抽取配置。 填写完信息后,单击“保存”。
  • 步骤1:准备数据 在创建图谱之前,您需要将用于创建图谱的基础数据上传至OBS桶及文件夹。 登录OBS服务控制台,创建桶和文件夹,用于存放样例数据集,创建名称为“kg-test”的OBS桶,名称为“demo-data”的文件夹。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 当前KG服务仅支持在“北京四”区域,建议创建OBS桶时,选择“北京四”区域。 单击数据集下载链接,将数据集下载至本地,并命名为“kg_demo.xlsx”。 参考上传文件,使用单个文件上传方式将“kg_demo.xlsx”文件上传至OBS路径“kg-test/demo-data”下。
  • 步骤3:选择图谱规格 登录KG服务管理控制台,默认进入“我的图谱”页面。 单击,然后在创建图谱页面填写信息。 图7 服务选型 表2 服务选型参数说明 参数 说明 “图谱名称” 待创建图谱的名称,名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。 “图谱规格” 待创建图谱的规格大小。当前仅支持在控制台选择“体验版 一万边”,如果根据业务需要,选择标准版 百万边、标准版 千万边、高级版 千万边,请通过官网产品页“服务咨询”联系我们进行咨询购买。 “是否购买套餐包” 体验版图谱默认不能开通套餐包。如果需要选择业务版图谱,请通过官网产品页“服务咨询”联系我们进行咨询购买。 单击右下角“下一步”,在“版本确认”页签确认版本信息。 单击右下角“确认创建”。 页面提示“知识图谱创建任务提交成功”。 单击“返回”,返回至“我的图谱”页面,您会看到新创建的图谱卡片,“运行状态”为“创建中”。等待十几分钟后,运行状态变为“初始化”状态。 图8 创建图谱
  • 步骤5:配置图谱本体 在流水线构建页面,单击“图谱本体”,页面下方弹出图谱本体配置对话框,单击右侧按钮可以放大对话框。 选择左侧“我的库”页签,在“图谱本体组件”中拖拽步骤2:创建本体中创建的本体“person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体
  • 步骤4:配置数据源 在“我的图谱”页面鼠标移至新创建的图谱卡片,单击“图谱构建WorkSpace”。 进入图谱流水线构建页面。 图9 图谱构建WorkSpace 在流水线构建页面,单击“数据源”,页面下方弹出数据源配置对话框,单击右侧按钮可以放大对话框。 图10 配置数据源 在数据源配置对话框,填写相关信息。 “选择数据格式”:此样例选择“XLSX”。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径: “OBS桶”:选择数据源文件存放的OBS桶“kg-test”。确保您使用的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 “存储路径”:选择数据源文件存放在OBS桶的文件路径“demo-data/kg_demo.xlsx”。 选择的OBS路径不能是加密路径,否则可能会访问失败。 “OBS桶授权”:如果OBS桶未授权,请勾选“确认授权”。 选择完成后,单击“确定”。 图11 选择数据源文件 填写完信息后,单击“保存”,完成数据源的配置。
  • URI POST /v1/{project_id}/kg/kg-instances/{kg_id}/apps/entity-linking 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 entities Array of EntityLinkingRespEntityMention objects 实体链接结果。 表4 EntityLinkingRespEntityMention 参数 参数类型 描述 entity_id String 链接到的图谱节点对应的实体id。 entity_title String 链接到的图谱节点对应的实体名称。 mention String 实体名称。 offset Integer 实体文本在待分析文本中的起始位置。
  • 请求示例 分析识别文本为 "李娜唱的青藏高原真好听"的实体 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/1604d8170cd84440a81281e5a3a04f8b/kg/kg-instances/6cdcea01-bac0-48f6-acb5-9385ea3e24ad/apps/entity-linking { "text" : "李娜唱的青藏高原真好听" }
  • 响应示例 状态码: 200 OK { "entities" : [ { "mention" : "李娜", "offset" : 0, "entity_id" : "6939670486880563336", "entity_title" : "李娜(流行歌手、佛门女弟子)" }, { "mention" : "青藏高原", "offset" : 4, "entity_id" : "8654144631589645401", "entity_title" : "青藏高原(李娜演唱歌曲)" } ] } 状态码: 400 Bad Request { "error_code" : "KGP.2007", "error_msg" : "kg not found" } 状态码: 403 Forbidden { "error_code" : "KGP.0004", "error_msg" : "Auth failed" }
  • 基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域 指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。 可用区 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 同样在我的凭证下,您可以查看项目ID。 企业项目 企业项目是项目的升级版,针对企业不同项目间资源的分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理服务用户指南》。 父主题: 使用前必读
  • URI POST /v1/{project_id}/kg/kg-instances/{kg_id}/apps/kbqa/converse 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。
  • 响应示例 状态码: 200 OK { "answer" : "小明的身高是175cm。", "session_id" : "b22ce1e7-72e6-4846-86e5-65f66a882989", "frame" : [ { "formatted_question" : "[小明]的[身高]", "match_type" : "SYS_TEMPLATE", "template_id" : "77396e46-6eec-49bb-bb84-84faa4229090", "template_name" : "xx实体的xx属性", "template_score" : 1.0, "query" : "g.V('6155801785020056890').valueMap('name', '身高').path()", "result" : { "vertices" : [ { "id" : "6155801785020056890", "label" : "人物" } ], "runtime" : 0.007594787999999999, "results" : [ { "name" : [ "小明" ], "身高" : [ "175cm" ] } ] }, "answer" : "小明的身高是175cm。" } ] } 状态码: 400 Bad Request { "error_code" : "KGP.2007", "error_msg" : "kg not found" } 状态码: 403 Forbidden { "error_code" : "KGP.0004", "error_msg" : "Auth failed" }
  • 请求示例 进行KBQA会话,询问小明的身高 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/1604d8170cd84440a81281e5a3a04f8b/kg/kg-instances/6cdcea01-bac0-48f6-acb5-9385ea3e24ad/apps/kbqa/converse { "session_id" : "b22ce1e7-72e6-4846-86e5-65f66a882989", "query" : "小明的身高" }