MAPREDUCE服务 MRS-Flink流式读Hudi表规则
Flink流式读Hudi表规则
Flink流式读Hudi表参数规范如下所示。
参数名称 |
是否必填 |
参数描述 |
示例 |
---|---|---|---|
Connector |
必填 |
读取表类型。 |
hudi |
Path |
必填 |
表存储的路径。 |
根据实际情况填写 |
table.type |
必填 |
Hudi表类型,默认值为COPY_ON_WRITE。 |
MERGE_ON_READ |
hoodie.datasource.write.recordkey.field |
必填 |
表的主键。 |
根据实际填写 |
write.precombine.field |
必填 |
数据合并字段。 |
根据实际填写 |
read.tasks |
选填 |
读Hudi表task并行度,默认值为4。 |
4 |
read.streaming.enabled |
必填 |
|
根据实际填写,流读场景下为true |
read.streaming.start-commit |
选填 |
指定 ‘yyyyMMddHHmmss’ 格式的起始commit(闭区间),默认从最新commit。 |
- |
hoodie.datasource.write.keygenerator.type |
选填 |
上游表主键生成类型。 |
COMPLEX |
read.streaming.check-interval |
选填 |
流读检测上游新提交的周期,默认值为1分钟。 |
5(流量大建议使用默认值) |
read.end-commit |
选填 |
|
- |
changelog.enabled |
选填 |
是否写入changelog消息。默认值为false,CDC场景填写为true。 |
false |
- Hudi服务_什么是Hudi_如何使用Hudi
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- 什么是Spark_如何使用Spark_Spark的功能是什么
- MapReduce服务_什么是MapReduce服务_什么是HBase
- MapReduce服务_什么是Flink_如何使用Flink
- MapReduce服务_什么是HDFS_HDFS特性
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper