检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OBS Manager 功能 通过OBS Manager节点可以将OBS文件移动或复制到指定目录下。 参数 用户可参考表1和表2配置OBS Manager节点的参数。
转储服务类型 是 选择转储服务类型,目前支持转储至: OBS:通道里的流式数据存储在DIS中,并周期性导入对象存储服务OBS;通道里的实时文件数据传输完成后,导入OBS。 单击,在弹出的对话框中配置转储任务的参数(参数说明请见《数据接入服务用户指南》)。
对象存储服务 数据开发模块服务支持从对象存储服务(Object Storage Service,简称OBS)导入数据,同时数据开发模块还利用OBS存储数据、结果、日志文件,以及用户程序。
前提条件 已开通对象存储服务,并在OBS中创建桶。 备份资产 登录DLF管理控制台。 在数据开发模块控制台的左侧导航栏,选择“备份管理”。 单击“启动每日备份”,打开“OBS文件浏览”页面,选择OBS文件夹,设置备份数据的存储位置。
Create OBS 功能 通过Create OBS节点在OBS服务中创建桶和目录。 参数 用户可参考表1和表2配置Create OBS节点的参数。
举例 以作业调度计划时间的前一天时间作为子目录名称,生成一个OBS路径,EL表达式如下: #{"obs://test/"+DateUtil.format(DateUtil.addDays(Job.planTime,-1),"yyyy-MM-dd")} 父主题: 表达式
单击“OBS桶”,进入OBS桶配置页面。 单击“作业日志OBS桶”和“DLI脏数据OBS桶”后的OBS,选择OBS桶名称并确认。 父主题: 配置
Delete OBS 功能 通过Delete OBS节点在OBS服务中删除桶和目录。 参数 用户可参考表1和表2配置Delete OBS节点的参数。
区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。
StringUtil内嵌对象 StringUtil内嵌对象提供了一系列字符串操作方法,例如从一个字符串中截取一个子字符串。 StringUtil内部是由org.apache.commons.lang3.StringUtils实现的,具体使用方法请参考appache commons文档
JSONUtil内嵌对象 JSONUtil内嵌对象提供了JSON对象方法。 方法 表1 方法说明 方法 描述 Object parse(String jsonStr) 将json字符串转换为对象。 String toString(Object jsonObject) 将对象转换为json
Env内嵌对象 Env内嵌对象提供了获取环境变量值的方法。 方法 表1 方法说明 方法 描述 String get(String name) 获取指定名称环境变量值。 举例 获取环境变量名称为test的参数值,EL表达式如下: #{Env.get("test")} 父主题: 表达式
环境准备 已开通对象存储服务OBS,并创建桶,例如“s3a://dlfexample”,用于存放Spark作业的JAR包。 已开通数据湖探索服务DLI,并创建Spark集群“spark_cluster”,为Spark作业提供运行所需的物理资源。
配置服务级Admin权限 因作业执行过程中,需要往obs写执行日志信息,因此粗粒度授权时,所有作业都需要添加 OBS OperateAccess权限。
Loop内嵌对象 使用Loop内嵌对象可获取for each数据集中的数据。 属性 表1 属性说明 属性 类型 描述 dataArray String For循环算子输入的数据集,是一个二维数组。 current String For循环算子当前遍历到的数据行,是一个一维数组。 offset
已开通对象存储服务,并在OBS中创建文件夹。 已将本地的数据连接上传至OBS文件夹。 数据连接的最大配额为20,当前数据连接的数量未达到最大配额。 操作步骤 登录DLF管理控制台。 在数据开发模块控制台的左侧导航栏,选择“数据开发 > 脚本开发”/“数据开发 > 作业开发”。
Job内嵌对象 Job为作业对象,提供了获取作业中上一节点的输出消息、作业调度计划时间、作业执行时间等属性和方法。 属性和方法 表1 属性说明 属性 类型 描述 name String 作业名称。 planTime java.util.Date 作业调度计划时间,即周期调度配置的时间
前提条件 已开通消息通知服务并配置主题,为主题添加订阅。 已提交作业,且作业不是“未启动”状态。 已开通对象存储服务,并在OBS中创建文件夹。 配置通知 登录DLF管理控制台。 在数据开发模块控制台的左侧导航栏,选择“运维调度 > 通知管理”。
图2 场景示例图 海量日志轻松分析挖掘 通过DIS将日志数据接入到OBS存储(或者Cloud Search服务),然后通过数据开发模块服务编写数据开发脚本和数据挖掘脚本,实现海量日志分析和挖掘。 图3 场景示例图
前提条件 已开通相应的云服务并在云服务中创建数据库。例如,开发DLI的脚本前,请确保DLI服务已开通,并在DLI服务中创建好数据库。Flink SQL脚本不涉及。 已在数据开发模块中创建与脚本的数据连接类型匹配的数据连接,请参见创建数据连接。Flink SQL脚本不涉及。