华为云首页用户手册

数据湖探索 DLI-提交SQL作业（推荐）:请求消息

数据湖探索 DLI-提交SQL作业（推荐）:请求消息

时间：2024-05-14 09:40:02

数据湖探索 DLI SQL作业相关API

请求消息

表2 请求参数
参数名称	是否必选	参数类型	说明
sql	是	String	待执行的SQL语句。
currentdb	否	String	SQL语句执行所在的数据库。当创建新数据库时，不需要提供此参数。
queue_name	否	String	待提交作业的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。
conf	否	Array of Strings	用户以“key/value”的形式设置用于此作业的配置参数。目前支持的配置项请参考表3。
tags	否	Array of Objects	作业的标签。具体请参考表4。
engine_type	否	String	默认是spark。

表3 conf参数说明
参数名称	默认值	描述
spark.sql.files.maxRecordsPerFile	0	要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。
spark.sql.autoBroadcastJoinThreshold	209715200	配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。
spark.sql.shuffle.partitions	200	为连接或聚合过滤数据时使用的默认分区数。
spark.sql.dynamicPartitionOverwrite.enabled	false	当前配置设置为“false”时，DLI在覆盖写之前，会删除所有符合条件的分区。例如，分区表中有一个“2021-01”的分区，当使用INSERT OVERWRITE语句向表中写入“2021-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“true”时，DLI不会提前删除分区，而是在运行时覆盖那些有数据写入的分区。
spark.sql.files.maxPartitionBytes	134217728	读取文件时要打包到单个分区中的最大字节数。
spark.sql.badRecordsPath	-	Bad Records的路径。

表4 tags参数
参数名称	是否必选	参数类型	说明
key	是	String	标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。
value	是	String	说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格。

上一篇：数据湖探索 DLI-提交SQL作业（推荐）:响应示例

下一篇：数据湖探索 DLI-提交SQL作业（推荐）:响应示例

数据湖探索 DLI-提交SQL作业（推荐）:请求消息

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题