数据湖探索 DLI-新建Flink Jar作业:请求消息

时间:2025-06-18 14:07:45

请求消息

表2 参数说明

参数名称

是否必选

参数类型

说明

name

String

作业名称。长度限制:1-57个字符。

desc

String

作业描述。长度限制:0-512个字符。

queue_name

String

队列名称。长度限制:0-128个字符。

cu_number

Integer

用户为作业选择的CU数量。

manager_cu_number

Integer

用户为作业选择的管理节点CU数量,对应为flink jobmanager数量。默认值为“1”。

parallel_number

Integer

用户为作业选择的并发量。

log_enabled

Boolean

是否开启作业日志。

  • 开启:true
  • 关闭:false
  • 默认:false

obs_bucket

String

“log_enabled”“true”时, 用户授权保存作业日志的OBS桶名。

smn_topic

String

当作业异常时,向该 SMN 主题推送告警信息。

main_class

String

作业入口类。

entrypoint_args

String

作业入口类参数,多个参数之间空格分隔。

restart_when_exception

Boolean

是否开启异常重启功能,默认值为“false”。

entrypoint

String

用户已上传到OBS的程序包名,用户自定义作业主类所在的jar包。

Flink1.15推荐配置OBS中的程序包,不推荐使用 DLI 程序包。Flink1.15以上版本将不再支持读取DLI程序包。

示例:obs://bucket_name/test.jar

dependency_jars

Array of Strings

用户已上传到OBS的程序包名,用户自定义作业的其他依赖包。

Flink1.15推荐配置OBS中的程序包,不推荐使用DLI程序包。Flink1.15以上版本将不再支持读取DLI程序包。

示例“obs://bucket_name/test1.jar, obs://bucket_name/test2.jar”。

dependency_files

Array of Strings

用户已上传到OBS的资源包名,用户自定义作业的依赖文件。

Flink1.15推荐配置OBS中的程序包,不推荐使用DLI程序包。Flink1.15以上版本将不再支持读取DLI程序包。

示例:"[obs://bucket_name/file1, obs://bucket_name/file2]"。

通过在应用程序中添加以下内容可访问对应的依赖文件。其中,“fileName”为需要访问的文件名,“ClassName”为需要访问该文件的类名。

ClassName.class.getClassLoader().getResource("userData/fileName")

tm_cus

Integer

每个taskmanager的CU数,默认值为“1”。

tm_slot_num

Integer

每个taskmanager的slot数,默认值为“(parallel_number*tm_cus)/(cu_number-manager_cu_number)”。

feature

String

作业特性。表示用户作业使用的Flink镜像类型。

  • basic:表示使用DLI提供的基础Flink镜像。
  • custom:表示使用用户自定义的Flink镜像。

flink_version

String

Flink版本。当用户设置“feature”“basic”时,该参数生效。用户可通过与“feature”参数配合使用,指定作业运行使用的DLI基础Flink镜像的版本。

execution_agency_urn

String

授权给DLI的委托名。Flink1.15版本时支持配置该参数。

image

String

自定义镜像。格式为:组织名/镜像名:镜像版本。

当用户设置“feature”“custom”时,该参数生效。用户可通过与“feature”参数配合使用,指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像,请参考《 数据湖探索 用户指南》。

resume_checkpoint

Boolean

异常重启是否从checkpoint恢复。

resume_max_num

Integer

异常重试最大次数,单位:次/小时。取值范围:-1或大于0。默认值为“-1”,表示无限次数。

checkpoint_path

String

用户Jar中checkpoint的储存地址,不同作业路径需要保持不同。

tags

Array of Objects

Flink jar作业的标签。具体请参考表3

runtime_config

String

Flink作业运行时自定义优化参数。

resource_config_version

String

资源配置版本。可选值 "v1" ,"v2".默认为“v1”。

v2版本对比于v1模版不支持设置CU数量,支持直接设置Job Manager Memory和Task Manager Memory。

v1:适用于Flink 1.12、Flink 1.13、Flink 1.15

v2:适用于Flink 1.13、Flink 1.15、Flink 1.17

优先推荐使用V2版本的参数设置。

resource_config

Object

Flink 作业的资源配置。 具体参数说明请参考表4

资源配置版本 为 "v2"时,配置生效,资源配置版本 为 "v1"时,配置无效。

表3 tags参数

参数名称

是否必选

参数类型

说明

key

String

标签的键。

说明:

标签的键的最大长度为128个字符,标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格,不能以_sys_开头。

value

String

标签的值。

说明:

标签值的最大长度为255个字符,标签的值可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格。

表4 resource_config参数说明

参数名称

是否必选

参数类型

说明

max_slot

integer

该参数用于设置单个TaskManager可以提供的并行任务数量。每个Task Slot可以并行执行一个任务。增加 Task Slots 可以提高 TaskManager 的并行处理能力,但也会增加资源消耗。

Task Slots的数量与TaskManager的CPU数相关联,因为每个CPU可以提供一个Task Slot。

单TM Slot默认值为1。最小并行数不能小于1。

parallel_number

integer

作业的并行数,指作业中各个算子的并行执行的子任务的数量,算子的子任务数就是其对应算子的并行度。默认值为“1”。

jobmanager_resource_spec

ResourceSpec

JobManager资源规格。具体参数说明请参考表5

taskmanager_resource_spec

ResourceSpec

TaskManager资源规格。具体参数说明请参考表6

表5 jobmanager_resource_spec参数说明

参数名称

是否必选

参数类型

说明

cpu

double

JobManager可以使用的CPU核数,默认值为1.0个CPU核数,最低不得小于0.5个CPU核数

memory

string

JobManager可以使用的内存,单位MB,GB。默认GB。默认值为4GB,最低不得小于2G。

表6 taskmanager_resource_spec参数说明

参数名称

是否必选

参数类型

说明

cpu

double

TaskManager可以使用的CPU核数,默认值为1.0个CPU核数,最低不得小于0.5个CPU核数

memory

string

TaskManager可以使用的内存,单位MB,GB。默认GB。默认值为4GB,最低不得小于2G

support.huaweicloud.com/api-dli/dli_02_0230.html