应用与数据集成平台 ROMA CONNECT-配置源端数据信息:DB2

时间:2024-05-07 17:09:59

DB2

返回页首

任务的“集成模式”为“定时”时,可以选择DB2作为源端数据源。

  1. 在创建任务页面中配置源端信息。
    表4 源端DB2信息

    参数

    配置说明

    源端实例

    选择当前正在使用的ROMA Connect实例。

    源端集成应用

    选择DB2数据源所属的集成应用,在接入数据源时已配置。

    源端数据类型

    选择“DB2”。

    数据源名称

    选择接入数据源中已配置的DB2数据源。

    插入SQL

    选择是否使用SQL语句来获取源端数据。

    • 开启,表示ROMA Connect根据填写的SQL语句来获取源端数据。
    • 不开启,表示ROMA Connect根据界面配置的条件来获取源端数据。

    若选择开启,则还需要填写查询数据的SQL语句。填写的语句必须为select语句并包含where条件,不能使用insert、update、delete、drop等语句。单击“检测SQL”,可以检测语句的有效性。

    例如,语句SELECT col01, col02 FROM table01 WHERE col02 IN('A', 'B', 'C') ORDER BY col01,表示从table01数据表中选取col01和col02这两列的数据,筛选列col02中值为A、B或C的数据行,并按照列col01的值进行顺序排列。

    源端表

    仅当“插入SQL”选择不开启时需要配置。

    选择DB2数据源中要获取数据的数据表。选择数据表后,单击“选择表字段”,可以只选择需要集成的数据列字段,例如:ID。

    按字段排序

    仅当“插入SQL”选择不开启时需要配置。

    配置要集成的数据是否按字段排序。若需要对集成的数据进行排序,则需要选择排序的参照字段,并选择“升序”或“降序”排序。

    是否增量迁移

    选择是否只集成指定时间段内的数据。

    首次调度采集是采集时间戳初始值到当前调度时间之间的数据,后续每一次调度采集的数据是上次采集的最后一条数据的入库时间到当前调度时间之间的数据。

    时区

    仅当“是否增量迁移”选择开启时需要配置。

    选择DB2数据源使用的时区,以便ROMA Connect识别数据的时间戳。

    时间戳字段

    仅当“是否增量迁移”选择开启且“插入SQL”不开启时需要配置。

    用于校验数据行是否符合增量集成条件,请选择一个“DATE”类型的字段。如果时间戳字段和时间戳初始值填写不完整,此任务默认为全量集成。

    时间戳初始值

    仅当“是否增量迁移”选择开启时需要配置。

    首次集成数据时,要集成数据的起始时间,即只集成该时间点之后的数据。

    重置迁移时间初始值

    该参数仅在编辑FDI任务时可配置。

    选择是否开启重置迁移时间初始值。

    开启:开启后,增量迁移时每次调度时开始的时间为时间戳初始值配置的时间。

    关闭:关闭时,增量迁移时每次调度的开始时间为上一次调度的结束时间。

    条件筛选

    仅当“插入SQL”选择不开启时需要配置。

    添加要集成数据的筛选条件,只把满足条件的源端数据集成到目标端。

    例如:条件“and | col02 | equal | A”表示只集成列col02中,值为“A”的数据行。

    扩展元数据

    仅当“插入SQL”选择不开启时需要配置。

    当数据库中某个字段的值为JSON格式,且需要采集该JSON格式值中的底层key-value型数据元素时需要配置。

    • 字段名:选择源表中需要采集子元素的数据字段名称。
    • 类型:JSON格式字段值中,要采集的数据元素的数据类型。
    • 解析路径:数据元素在JSON格式值中的完整路径,具体请参见扩展元数据解析路径配置说明

    扩展元数据解析路径配置说明

    • JSON格式数据中不含数组

      如以下JSON格式数据,元素a的完整路径定义为a,元素b的完整路径为a.b,元素c的完整路径为a.b.c,元素d的完整路径为a.b.d。元素c和d为底层数据元素,即需要通过ROMA Connect集成到目标端的数据。

      此场景下,元素c的解析路径需要设置为a.b.c,元素d的解析路径需设置为a.b.d

      {
         "a": {
            "b": {
               "c": "xx",
               "d": "xx"
            }
         }
      }
    • JSON格式数据中含数组

      如以下JSON格式数据,元素a的完整路径定义为a,元素b的完整路径为a.b,元素c的完整路径为a.b[i].c,元素d的完整路径为a.b[i].d。元素c和d为底层数据元素,即需要通过ROMA Connect集成到目标端的数据。

      此场景下,元素c的解析路径需要设置为a.b[i].c,元素d的解析路径需设置为a.b[i].d

      {
         "a": {
            "b": [{
               "c": "xx",
               "d": "xx"
            },
            {
               "c": "yy",
               "d": "yy"
            }
            ]
         }
      }
    • 增量迁移不支持将源端数据表中的物理删除操作同步给目标端,建议在源端使用逻辑删除。
    • 对于源端的数据变更,需要同步更新数据行的时间戳,ROMA Connect通过时间戳与任务执行时间点进行对比,识别需增量迁移的数据。

    源端为DB2的配置与MySQL的类似,配置示例可参考MySQL配置示例

  2. 完成源端信息配置后,继续进行下一部分配置,配置目标端数据信息
support.huaweicloud.com/usermanual-roma/fdi-ug-190624006.html