推荐系统 RES-提交数据质量作业API:请求参数

时间:2023-11-01 16:16:29

请求参数

请求参数参见表2

表2 请求参数说明

参数名称

是否必选

参数类型

说明

workspace_id

String

工作空间ID,默认为0

job_name

String

训练作业名称,最大长度为20字符。必须以DataQuality-开头。

job_description

String

训练作业描述,最大长度为256字符。

algorithm_type

String

算法类型

  • DATA_QUALITY_INSPECTION

algorithm_parameters

JSON

算法参数,每一种算法都有其特定的参数。

  • DATA_QUALITY_INSPECTION,请参见表7

data_source

List

算法数据源配置

  • DATA_QUALITY_INSPECTION,数据源选择通用模板数据,请参见表5

offline_platform

JSON

请参见表3,离线计算平台信息。

表3 offline_platform参数说明

参数名称

是否必选

参数类型

说明

platform

String

平台名称,最大长度64,支持 DLI

platform_parameter

JSON

请参见表4,平台参数。

computing_resource

String

指定DLI运行任务的资源规格。

config_load_path

String

读取配置源路径。

表4 platform_parameter参数说明

参数名称

是否必选

参数类型

说明

cluster_name

String

集群名称。

cluster_id

String

集群ID。

表5 data_source参数说明

参数名称

是否必选

参数类型

说明

table_type_id

String

推荐通用数据模板

  • 用户属性表USER_META
  • 物品属性表ITEM_META
  • 用户操作行为表USER_BEHAVIOR

数据格式请参见推荐系统离线数据源

通用格式

  • GENERAL_FORMAT

data_source_url

String

数据源路径,最大长度1000字符

data_format

String

输入数据格式,可选值:csv、parquet、json、orc。

data_param

JSON

请参见表6,数据格式是csv的时候必选,其他可选。

表6 data_param参数说明

参数名称

是否必选

参数类型

说明

header

Boolean

是否显示表头。

delimiter

String

分割符,最大长度10个字符。

quote

String

引用字符,最大长度10个字符。

escape

String

转义字符,最大长度10个字符。

表7 algorithm_parameters参数说明-DATA_QUALITY_INSPECTION算子

参数名称

是否必选

参数类型

说明

输出路径(result_path)

String

所有输出数据(错误数据以及错误信息)的存储路径,文件夹。

全局特征配置文件路径(global_features_information_path)

String

该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。

support.huaweicloud.com/api-res/res_02_0036.html