数据湖探索 DLI-执行SQL作业时产生数据倾斜怎么办?:JOIN数据倾斜解决方案

时间:2024-03-30 09:27:36

JOIN数据倾斜解决方案

  1. 登录数据湖探索管理控制台,选择“SQL作业”,在要修改的作业所在行的“操作”列,单击“编辑”进入SQL编辑器界面。
  2. 在SQL编辑器界面,单击“设置”,在“配置项”尝试添加以下几个Spark参数进行解决。

    参数项如下,冒号前是配置项,冒号后是配置项的值。

    spark.sql.enableToString:false
    spark.sql.adaptive.join.enabled:true
    spark.sql.adaptive.enabled:true
    spark.sql.adaptive.skewedJoin.enabled:true
    spark.sql.adaptive.enableToString:false
    spark.sql.adaptive.skewedPartitionMaxSplits:10

    spark.sql.adaptive.skewedPartitionMaxSplits表示倾斜拆分力度,可不加,默认为5,最大为10。

  3. 单击“执行”重新运行作业,查看优化效果。
support.huaweicloud.com/dli_faq/dli_03_0093.html