数据接入服务 DIS-使用DIS采集增量驾驶行为日志数据:添加转储任务
添加转储任务
- 使用注册账户登录DIS控制台。
- 在左侧列表栏中选择“通道管理”。
- 单击申请DIS通道中创建的通道名称,进入所选通道的管理页面,选择“转储管理”页签。
- 单击“添加转储任务”按钮,在弹出的“添加转储任务”页面配置转储相关配置项。
- 每个通道最多可创建5个转储任务。
- 源数据类型为FILE的通道,不允许添加转储任务。
- 单击“立即创建”。
表1 转储任务参数说明 参数
参数解释
配置值
转储服务类型
选择OBS。
通道里的流式数据存储在DIS中,并周期性导入对象存储服务(Object Storage Service,简称OBS)。
通道里的实时文件数据传输完成后,导入OBS。
OBS
任务名称
用户创建转储任务时,需要指定转储任务名称,同一通道的转储任务名称不可重复。任务名称由英文字母、数字、中划线和下划线组成。长度为1~64个字符。
-
转储文件格式
- text
- csv
- parquet
- carbon
根据需要选择。
数据转储地址
存储该通道数据的OBS桶名称。桶名称在“对象存储服务”中“创建桶”时创建。
申请DIS通道创建的桶名称。
转储文件目录
在OBS中存储通道文件的自定义目录,多级目录可用“/”进行分隔,不能以“/”开头。
取值范围:0~50个字符。
默认配置为空。
-
时间目录格式
数据将存储在OBS桶中转储文件目录下,按时间格式作为层级的目录中。
当选择的时间目录格式精确到日时,存储目录为“桶名称/转储文件目录/年/月/日”。
取值范围:- N/A:置空,不使用日期时间目录。
- yyyy:年
- yyyy/MM:年/月
- yyyy/MM/dd:年/月/日
- yyyy/MM/dd/HH:年/月/日/时
- yyyy/MM/dd/HH/mm:年/月/日/时/分
此配置项仅支持选择,不可手动输入。
-
记录分隔符
进行OBS周期转储时,分隔不同转储记录的分隔符。
取值范围:- 逗号 ","
- 分号 ";"
- 竖线 "|"
- 换行符 "\n"
- NULL
此配置项仅支持选择,不可手动输入。
-
偏移量
- 最新:最大偏移量,即获取最新的数据。
- 最早:最小偏移量,即读取最早的数据。
最新
数据转储周期
根据用户配置的时间,周期性的将数据导入OBS,若某个时间段内无数据,则此时间段不会生成打包文件。
取值范围:30~900。
单位:秒。
默认配置为300秒。
-