MAPREDUCE服务 MRS-HBase数据:Replication

时间:2024-04-16 08:56:36

Replication

Replication备份是在HBase上建立主备集群的容灾关系,当数据写入主集群,主集群通过WAL来主动push数据到备集群上,从而达到主备集群的实时同步。详情请参考http://hbase.apache.org/2.2/book.html#_cluster_replication

  • 该方式数据备份的优点:
    • 使用replication有别于其他几种数据备份导入方式,当配置了集群间的主备关系后,数据可以实时同步(无需人为操作)。
    • 相对而言,“备份”的动作占用集群的资源较少,对集群的性能影响小。
    • 数据同步可靠性较高,如果备集群停止一段时间后再恢复,这中间主机群的数据依然会同步到备集群。
  • 该方式数据备份的缺点和限制:
    • 如果客户端写入的数据设置不写WAL,则数据无法备份到备集群。
    • 由于占用的资源少,后台是通过异步的方式同步数据,实际数据没有实时同步。
    • 对于开启表replication同步之前,主集群就已经存在的数据无法同步,需要借助其他方式导入的备集群。
    • bulkload方式写入到主集群的数据无法同步(MRS上的HBase对replication做了增强,支持bulkload on replication)。

具体的使用和配置方法请参考配置HBase备份使用ReplicationSyncUp工具来进行备份数据。

support.huaweicloud.com/bestpractice-mrs/mrs_05_0039.html