数智融合计算服务 DATAARTSFABRIC-CREATE EXTERNAL TABLE:参数说明
参数说明
- IF NOT EXISTS
如果存在同名表,则发出一个notice而不是抛出一个错误。
- schema_name
表所属的数据库名,如果未指定数据库名时,则将在current_schema下建表。
- table_name
创建表的表名,表名长度不可超过63个字符。
- col_name
创建表的列名,列名长度不可超过63个字符。普通列和分区列的数量总和不可超过5000个。
- col_type
创建表的列类型,列类型支持范围如下:
列类型
是否可以声明为分区列
是否支持ORC格式
是否支持PARQUET格式
是否支持Iceberg格式
SmallInt
√
√
√
√
Int
√
√
√
√
BigInt
√
√
√
√
Float
×
√
√
√
Double
×
√
√
√
Decimal
√
√
√
√
Numeric
√
√
√
√
Timestamp
√
√
√
√
Date
√
√
√
√
Varchar
√
√
√
√
Char
√
√
√
√
Bool
×
√
√
√
Bytea
×
√
√
√
Text
√
√
√
√
- col_comment
列注释信息,可指定为任意字符串。
- table_comment
表注释信息,可指定为任意字符串。
- bucket_num
bucket个数。
- option_key = option_value
表级别参数设置,支持参数范围如下:
表1 option_key参数支持范围 option_key
option_value
说明
适用范围
orc.compress
zlib, snappy, lz4
ORC文件压缩方式。
ORC
parquet.compression
zlib, snappy, lz4
PARQUET文件压缩方式。
PARQUET
julian_adjust
true, false
是否转换为Julian日期。
PARQUET
checkencoding
high, low, no
是否检查字符编码。
ORC, PARQUET
column_index_access
true, false
读取时表定义列和文件列匹配方式,默认true为列索引匹配,false为列名匹配。
ORC, PARQUET
filesize
1~1024的证书
生成外表文件大小。
ORC, PARQUET
write.delete.mode
copy-on-write, merge-on-read
设置delete时的模式:cow或mor。
Iceberg
write.update.mode
copy-on-write, merge-on-read
设置update时的模式:cow或mor。
write.merge.mode
copy-on-write, merge-on-read
设置merge时的模式:cow或mor。
write.parquet.compression-codec
zstd, zlib, lz4, snappy, gzip
parquet文件的压缩方式。
write.merge.isolation-level
snapshot, serializable
merge命令的隔离级别。
write.metadata.delete-after-commit.enabled
true, false
控制提交后是否删除最旧的跟踪版本元数据文件。
write.update.isolation-level
snapshot, serializable
update命令的隔离级别。
write.delete.isolation-level
snapshot, serializable
delete命令的隔离级别。
write.metadata.previous-versions-max
大于0的整数
要保留的旧元数据文件的数
- table_format
表存储格式,支持ORC、PARQUET、ICEBERG三种存储格式。
- table_path
表存储路径,必须为合法OBS路径,支持OBS对象桶和并行文件系统。如果该路径为OBS对象桶路径,则该表只读,否则该表支持读写。
- select_stmt
查询语句。
- table_format