华为云首页用户手册

MapReduce服务 MRS-Cleaning

MapReduce服务 MRS-Cleaning

时间：2023-11-01 16:25:29

MapReduce服务 MRS

Cleaning

Cleaning用于清理不再需要的版本数据。

Hudi使用Cleaner后台作业，不断清除不需要的旧得版本的数据。通过配置hoodie.cleaner.policy和hoodie.cleaner.commits.retained可以使用不同的清理策略和保存的commit数量。

执行cleaning有两种方式：

同步clean由参数hoodie.clean.automatic控制，默认自动开启。
关闭同步clean：
datasource写入时可以通过.option("hoodie.clean.automatic", "false")来关闭自动clean。
spark-sql写入时可以通过set hoodie.clean.automatic=false;来关闭自动clean。
异步clean可以使用spark-sql来执行。

更多clean相关参数请参考compaction&cleaning配置章节。

父主题： 数据管理维护

上一篇：MapReduce服务 MRS-Clustering:Clustering架构

下一篇：MapReduce服务 MRS-Clustering:Clustering架构

MapReduce服务 MRS-Cleaning

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题