MapReduce服务 MRS-INSERT INTO:注意事项

时间:2023-11-01 16:25:25

注意事项

  • Insert模式:Hudi对于设置了主键的表支持三种Insert模式,用户可以设置参数hoodie.sql.insert.mode来指定Insert模式,默认为upsert。
    • strict模式,Insert 语句将保留 COW 表的主键唯一性约束,不允许重复记录。如果在插入过程中已经存在记录,则会为 COW 表抛出 HoodieDuplicateKeyException;对于MOR表,该模式与upsert模式行为一致。
    • non-strict模式,对主键表采用insert处理。
    • upsert模式,对于主键表的重复值进行更新操作。
  • 在执行spark-sql时,用户可以设置“hoodie.sql.bulk.insert.enable = true”和“hoodie.sql.insert.mode = non-strict”来开启bulk insert作为Insert语句的写入方式。

    也可以通过直接设置hoodie.datasource.write.operation的方式控制insert语句的写入方式,包括bulk_insert、insert、upsert。使用这种方式控制hoodie写入,需要注意执行完SQL后,必须执行reset hoodie.datasource.write.operation;重置Hudi的写入方式,否则该参数会影响其他SQL的执行。

support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_24273.html