MAPREDUCE服务 MRS-HTML输入:参数说明

时间:2024-04-22 14:51:40

参数说明

表1 算子参数说明

参数

含义

类型

是否必填

默认值

父标签

所有字段的上层HTML标签,用于限定搜索范围

string

文件名

自定义一个字段,以当前数据所在的文件名作为该字段值。

string

绝对文件名

配置“文件名”引用文件名环境,选中单选框时是带绝对路径的文件名;不选中单选框时是不带路径的文件名。

boolean

验证输入字段

是否检验输入字段与值的类型匹配情况,值为“NO”,不检查;值为“YES”,检查。如果不匹配则跳过该行。

enum

YES

输入字段

配置输入字段的相关信息:

  • 位置:目标字段对应的位置,从1开始编号。
  • 字段名:配置字段名。
  • 字段所在的标签:字段的标签。
  • 关键字:配置关键字,能够匹配标签所在的内容,支持通配符,例如标签内容为“姓名”,可配置关键字“*姓名*”
  • 类型:配置字段类型。
  • 数据格式:字段类型为“DATE”“TIME”“TIMESTAMP”时,需指定特定时间格式,其他字段类型指定无效。时间格式如:“yyyyMMdd HH:mm:ss”
  • 长度:配置字段长度,字段值太长则按配置的长度截取,“类型”“CHAR”时实际长度不足则空格补齐,“类型”“VARCHAR”时实际长度不足则不补齐。

map

support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_1126.html