检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
任务组 否 选择任务组。任务组配置好后,可以更细粒度地进行当前任务组中的作业节点的并发数控制,比如作业中包含多个节点、补数据、重跑等场景。 表3 血缘关系 参数 说明 输入 新建 单击“新建”,在“类型”的下拉选项中选择要新建的类型。可以选择DWS,OBS,CSS,HIVE,CUSTOM和DLI类型。
planTime)} int getQuarter(Date date) 从date获取季度,例如:date为2018-09-14,则返回3。 从日期获取具体的季度。 #{DateUtil.getQuarter(Job.planTime)} int getYear(Date date)
b”,“参数值”为“123”。 打开作业“test”,从左侧节点库中拖拽一个“Create OBS”节点。 在节点属性页签中配置属性。 图3 Create OBS 单击“保存”后,选择“前往监控”页面监控作业的运行情况。 父主题: 配置
用户可以根据实际需要对规则进行分目录存放,每级目录旁边的数字代表属于该级目录的规则实例的个数。 2 规则实例列表 展示实例名称、类型、运行状态、运行结果等信息。 3 管理区域 可以对所选实例进行导出、删除、停止运行的操作。 4 搜索区域 可以选择性地展示规则实例,例如运行的开始时间和结束时间处于某一时间区间实例。
脚本开发”。 在脚本目录中,双击脚本名称,进入脚本开发页面。 在页面右侧单击“版本”,查看版本提交记录,勾选需要对比的版本,单击“版本对比”。 图3 对比版本 单击“版本对比”后,将会打开新窗口,左右两边分别展示出不同版本的脚本内容。两个版本的不同之处将会被标识出来以便用户查看,右上角有
单击“查看”即可。 单击查看,将会打开一个新窗口,展示出该版本的作业定义。查看窗口仅用于展示某个版本的作业属性,不可修改任何作业属性。 图3 版本详情查看 版本对比 参考访问DataArts Studio实例控制台,登录DataArts Studio管理控制台。 在DataArts
n脚本。 Python脚本 在“Python脚本”参数后选择需要执行的Python脚本,系统自动默认显示Python版本,例如Python3。如果脚本未创建,请参考新建脚本和开发Python脚本先创建和开发脚本。 说明: 若选择Python语句方式,数据开发模块将无法解析您输入Python语句中携带的参数。
原始告警表为数据中心的实时数据,包含告警ID、告警级别。示例数据如表1所示。 表1 原始数据示例 alarm_id alarm_type 00440114 3 00440121 5 00440122 6 00440123 7 00440124 8 00440126 0 创建DIS通道 我们需要在D
从字符串中指定的位置往后查找,获取指定字符串的第一个索引,没有则转换为“-1”。例如“aabaabaa”中索引3的后面,第一个“b”的索引是5。 表达式:StringUtils.indexOf(value,"b",3) 从字符串获取指定字符串中任一字符的第一个索引,没有则返回整数-1。例如从“zzaby
被锁定影响使用。 支持的同步对象范围 在使用Migration进行同步时,不同类型的链路,支持的同步对象范围不同,详细情况可参考下表。 表3 同步对象范围 类型名称 使用须知 同步对象范围 支持同步DML:包括INSERT、UPDATE、DELETE。 不支持同步DDL。 仅支持同步有主键表。
从字符串中指定的位置往后查找,获取指定字符串的第一个索引,没有则转换为“-1”。例如“aabaabaa”中索引3的后面,第一个“b”的索引是5。 表达式:StringUtils.indexOf(value,"b",3) 从字符串获取指定字符串中任一字符的第一个索引,没有则返回整数-1。例如从“zzaby
主题流程配置用于自定义主题设计中的主题层级和自定义属性。系统默认有三个层级,从上到下分别命名为主题域分组(L1)、主题域(L2)、业务对象(L3)。您可以自定义的主题层级限制在最大7层,最少2层。自定义属性最多可以配置10个。 在DataArts Studio控制台首页,选择对应工作
被锁定影响使用。 支持的同步对象范围 在使用Migration进行同步时,不同类型的链路,支持的同步对象范围不同,详细情况可参考下表。 表3 同步对象范围 类型名称 使用须知 同步对象范围 支持同步DML:包括INSERT、UPDATE、DELETE。 不支持同步DDL。 仅支持同步有主键表。
在没有主键的场景下,如果没有选择分布列,DWS会默认第一列作为分布列,可能会有数据倾斜风险。 配置任务属性。 通过任务配置,控制数据同步过程的相关属性,具体请参见表3。 表3 任务配置参数 参数 说明 取值样例 作业期望最大并发数 设置当前作业从源端并行读取或并行写入目标端的最大线程数,由于分片策略等原因,实际运行过程中的并发线程数可能小于此值。
)、中划线(-)、下划线(_)、冒号(:)。 在“属性配置”中添加维度属性,单击“新建”按钮,可以添加多个维度属性。 图2 属性配置 表3 属性配置 参数名称 说明 属性名称 只允许除\、<、>、%、"、'、;及换行符以外的字符。 属性英文名称 只能包含英文字母、数字和下划线,且英文字母开头。
多个DataArts Studio实例需要指定工作空间。 当工作空间里面没有default工作空间时,工作空间为必填参数,否则会报错。 响应参数 表3 参数说明 参数名 是否必选 参数类型 说明 jobName 是 String 作业名称。 instanceId 是 Long 作业实例ID。
同时,可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中,添加优化参数。 图2 添加自定义属性 表3 Hudi写入优化参数 参数名 类型 默认值 说明 hoodie.sink.flush.tasks int 1 Hudi flush数据时的
"OBS:*:*:bucket:dli-trans*" ] } ] } 图3 配置obs_dli-trans自定义策略 单击“确定”,完成obs_dli-trans自定义策略创建。 在IAM左侧导航窗格中,选择“用户
单击左侧导航树中的“数据识别规则”,在数据识别规则页面中单击“数据入湖检测规则”,进入数据入湖检测规则页签。 在“数据入湖检测规则”页面中,单击配置规则。 图3 数据入湖检测规则页面 图4 配置数据入湖检测规则 在弹出的规则配置窗口中,选择所需的识别规则,单击“提交”完成规则选择。 图5 配置规则 相关操作
getNodeOutput("count95"),"]")[0],"[")[0],"\\"")[0]},选择Kafka连接和Topic名称。 图3 配置Kafka Client节点参数 作业节点配置完成后,选择测试运行。待作业测试运行成功后,在Kafka Client节点上右键查看日志,可以发现MRS