数据接入服务 DIS-使用DIS采集增量驾驶行为日志数据:添加转储任务

时间:2024-04-15 20:06:58

添加转储任务

  1. 使用注册户登录DIS控制台。
  2. 在左侧列表栏中选择“通道管理”。
  3. 单击申请DIS通道中创建的通道名称,进入所选通道的管理页面,选择“转储管理”页签。
  4. 单击“添加转储任务”按钮,在弹出的“添加转储任务”页面配置转储相关配置项。

    • 每个通道最多可创建5个转储任务。
    • 源数据类型为FILE的通道,不允许添加转储任务。

  5. 单击“立即创建”

    表1 转储任务参数说明

    参数

    参数解释

    配置值

    转储服务类型

    选择OBS。

    通道里的流式数据存储在DIS中,并周期性导入对象存储服务(Object Storage Service,简称OBS)。

    通道里的实时文件数据传输完成后,导入OBS。

    OBS

    任务名称

    用户创建转储任务时,需要指定转储任务名称,同一通道的转储任务名称不可重复。任务名称由英文字母、数字、中划线和下划线组成。长度为1~64个字符。

    -

    转储文件格式

    • text
    • csv
    • parquet
    • carbon

    根据需要选择。

    数据转储地址

    存储该通道数据的OBS桶名称。桶名称在“对象存储服务”中“创建桶”时创建。

    申请DIS通道创建的桶名称。

    转储文件目录

    在OBS中存储通道文件的自定义目录,多级目录可用“/”进行分隔,不能以“/”开头。

    取值范围:0~50个字符。

    默认配置为空。

    -

    时间目录格式

    数据将存储在OBS桶中转储文件目录下,按时间格式作为层级的目录中。

    当选择的时间目录格式精确到日时,存储目录为“桶名称/转储文件目录/年/月/日”。

    取值范围:
    • N/A:置空,不使用日期时间目录。
    • yyyy:年
    • yyyy/MM:年/月
    • yyyy/MM/dd:年/月/日
    • yyyy/MM/dd/HH:年/月/日/时
    • yyyy/MM/dd/HH/mm:年/月/日/时/分

    此配置项仅支持选择,不可手动输入。

    -

    记录分隔符

    进行OBS周期转储时,分隔不同转储记录的分隔符。

    取值范围:
    • 逗号 ","
    • 分号 ";"
    • 竖线 "|"
    • 换行符 "\n"
    • NULL

    此配置项仅支持选择,不可手动输入。

    -

    偏移量

    • 最新:最大偏移量,即获取最新的数据。
    • 最早:最小偏移量,即读取最早的数据。

    最新

    数据转储周期

    根据用户配置的时间,周期性的将数据导入OBS,若某个时间段内无数据,则此时间段不会生成打包文件。

    取值范围:30~900。

    单位:秒。

    默认配置为300秒。

    -

support.huaweicloud.com/bestpractice-dis/dis_08_0006.html