MapReduce服务 MRS-CarbonData调优思路:数据加载性能调优
数据加载性能调优
数据加载性能调优与查询性能调优差异很大。跟查询性能一样,数据加载性能也取决于可达到的并行性。在数据加载情况下,工作线程的数量决定并行的单元。因此,更多的执行器就意味着更多的执行器核数,每个执行器都可以提高数据加载性能。
同时,为了得到更好的性能,可在HDFS中配置如下参数。
参数 |
建议值 |
---|---|
dfs.datanode.drop.cache.behind.reads |
false |
dfs.datanode.drop.cache.behind.writes |
false |
dfs.datanode.sync.behind.writes |
true |