HBase/CloudTable增量迁移 使用CDM导出HBase(包括MRS HBase、FusionInsight HBase、Apache HBase)或者表格存储服务(CloudTable)的数据时,支持导出指定时间段内的数据,配合CDM的定时任务,可以实现HBase/CloudTable
输出数据路径 否 选择输出数据存储的路径。 表2 高级参数 参数 是否必选 说明 节点状态轮询时间(秒) 是 设置轮询时间(1~60秒),每隔x秒查询一次节点是否执行完成。
TopN 父主题: 数据服务API
父主题: 数据服务
父主题: 服务资源访问控制
从其他作业启动:选择checkpoint存储路径,支持输入HDFS或者OBS路径。 配置作业基本信息 表3 作业基本信息 参数 说明 责任人 自动匹配创建作业时配置的作业责任人,此处支持修改。 作业委托 当“作业调度身份是否可配置”设置为“是”,该参数可见。
DataArts Studio是针对企业数字化运营诉求提供的数据全生命周期管理、具有智能数据管理能力的一站式治理运营平台,包含数据集成、数据架构、数据开发、数据质量、数据目录、数据服务等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座,帮助企业快速构建从数据接入到数据分析的端到端智能数据系统
请确保委托中包含以下权限:DLI FullAccess、OBS Administrator、IAM的授予向云服务传递委托的权限。 关于IAM的授予向云服务传递委托的权限,如果使用的是IAM角色或策略授权:请授予iam:agencies:*权限。
当工作空间内已配置数据服务的API目录权限策略时,对于非授权对象的普通用户(即非DAYU Administrator、Tenant Administrator、数据安全管理员或预置的工作空间管理员角色的用户)而言,数据服务中的所有API目录将由于无权限而置灰,具体影响包括:不能新建
OBS上存储脏数据的目录,只有在配置了脏数据目录的情况下才会记录脏数据。 用户可以进入脏数据目录,查看作业执行过程中处理失败的数据或者被清洗过滤掉的数据,针对该数据可以查看源数据中哪些数据不符合转换、清洗规则。
消息系统 DMS Kafka 对象存储:OBS 单表 整库 DMS Kafka同步到OBS作业配置 DMS Kafka到OBS参数调优 Kafka集群支持使用版本:2.7、3.x版本。 Apache Kafka 部署方式:自建、其他云。
否 脏数据策略 “是否写入脏数据”为是时显示该参数,当前支持以下策略: 不归档:不对脏数据进行存储,仅记录到任务日志中。 归档到OBS:将脏数据存储到OBS中,并打印到任务日志中。 不归档 脏数据写入连接 “脏数据策略”选择归档到OBS时显示该参数。
私密属性 否 可选参数,JDBC私密属性,配置后将会进行加密存储,创建连接时会拼接到连接属性中。例如:key1=value1&key2=value2 父主题: 配置DataArts Studio数据连接参数
可以输入jar包名称,也可以输入对应jar包文件的OBS路径,格式为:obs://桶名/文件夹路径名/包名。在选择资源包之前,您需要先将Jar包及其依赖包上传至OBS桶中,并在“资源管理”页面中新建资源,具体操作请参考新建资源。
网关管理接口 获取网关实例(专享版) 获取网关分组 父主题: 数据服务API
消息管理接口 查询消息列表 处理消息 获取消息详情 父主题: 数据服务API
申请管理接口 查询申请列表 审核申请 获取申请详情 父主题: 数据服务API
在历史版本中,DataArts Studio自动创建的dlg_agency云服务委托,默认包含DLI、DWS、MRS、RDS、OBS、SMN、KMS等相关服务的管理员权限。
否 脏数据策略 “是否写入脏数据”为是时显示该参数,当前支持以下策略: 不归档:不对脏数据进行存储,仅记录到任务日志中。 归档到OBS:将脏数据存储到OBS中,并打印到任务日志中。 不归档 脏数据写入连接 “脏数据策略”选择归档到OBS时显示该参数。
通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 表3 请求Body参数 参数 是否必选 参数类型 描述 jobs 是 Array of Job objects 作业列表,请参见jobs数据结构说明。