云服务器内容精选

  • 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 { "ie_type": "function", "function_ie_configs": { "default_config": true, "ie_configs": { "Person": [ { "key": "identifier", "value_function": "${url}" }, { "key": "中文名", "value_function": "regexp_replace(${中文名}, '\\(\\[link\\]@.*?:(/film.*?)\\)', '')" }, { "key": "国籍", "value_function": "regexp_replace(${国籍}, '\\(\\[link\\]@.*?:(/film.*?)\\)', '')" }, { "key": "职业", "value_function": "${职业}" }, { "key": "出生日期", "value_function": "${出生日期}" }, { "key": "url", "value_function": "${url}" } ], "Film": [ { "key": "identifier", "value_function": "${url}" }, { "key": "中文名", "value_function": "${中文名}" }, { "key": "票房", "value_function": "${票房}" }, { "key": "上映时间", "value_function": "${上映时间}" }, { "key": "导演", "value_function": "regexp_extract_all(${导演}, '\\(\\[link\\]@.*?:(/film.*?)\\)', 1)" }, { "key": "主演", "value_function": "regexp_extract_all(${主演}, '\\(\\[link\\]@.*?:(/film.*?)\\)', 1)" }, { "key": "url", "value_function": "${url}" } ] } }}
  • 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“代码编辑”。 图1 信息抽取 选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。 在“代码编辑”页签编辑json代码配置信息抽取时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 若创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。