华为云用户手册

  • 前提条件 24.6.0及之前版本,需要待重保护的生产站点服务器已完成预配置;如果还未进行预配置,请参考配置生产站点服务器进行配置。 24.9.0及之后版本支持自动配置容灾网关功能(即在重保护过程不再需要配置生产站点服务器)。24.6.0及之前版本实现该功能,需要将网关及生产服务器的sdrs软件升级至24.9.0或之后版本,并参照配置云容灾网关重新配置网关。 保护实例状态为“切回完成”或者“重保护失败”。
  • 操作步骤 以下操作以“24.9.0”版本的代理客户端“sdrs_xxxx_24.9.0.xxxx.tar.gz”为例。 在云容灾网关服务器上获取新版本代理客户端软件包“sdrs_xxxx_24.9.0.xxxx.tar.gz”。 以root权限执行以下升级命令,批量升级代理客户端。 /opt/cloud/sdrs/sidecar/script/cmd_tools.sh upgrade --ip=ip_list --package=package_path --timeout=cmd_timeout_in_s 参数说明: --ip:需要升级的生产站点服务器私有ip列表,多个ip之间使用逗号分隔 --package:需要升级的Linux安装包sdrs_xxxx_24.9.0.xxxx.tar.gz的路径 --timeout:升级命令执行超时时间,单位:秒。默认值:300,建议值:需要批量升级的服务器数量*200(单台生产站点服务器升级代理客户端的时间,若为Windows客户端则建议单台升级超时时间为300) 完整命令示例: /opt/cloud/sdrs/sidecar/script/cmd_tools.sh upgrade --ip=192.168.0.6,192.168.0.188,192.168.0.204 --package=sdrs_xxxx_24.9.0.xxxx.tar.gz --timeout=600 当交互框出现确认提示框时,输入“y”继续执行升级。 如果界面回显中包含“upgrade SDRS successfully”信息,则表示所有生产站点服务器升级成功。
  • 前提条件 已安装云容灾网关。若客户端为linux,云容灾网关为24.6.0及更高版本;若客户端为windows,则要求云容灾网关为24.9.0及更高版本。 需要升级的生产站点服务器已安装代理客户端,若生产站点服务器为Linux操作系统,代理客户端为24.6.0及更高版本,若生产站点服务器为Windows操作系统,代理客户端为24.9.0及更高版本。 在Linux代理客户端升级前,需使用命令getenforce检查SELinux的模式,若为Enforcing模式,则需要临时关闭Enforcing模式或设置为Permissive模式,待升级完成后再恢复配置。
  • 操作场景 切换完成后,数据不会自动反向同步(容灾站点到生产站点),保护实例处于停止保护状态,如需开始反向数据同步,需要进行反向重保护操作。 执行反向重保护后,在初始同步过程中,如果容灾站点服务器重启,数据会重新进行同步,直到同步完成。 反向重保护时会将原生产站点服务器关机,状态变为“计划性关机”。 反向重保护会将容灾站点服务器的数据覆盖原生产站点服务器数据,在执行切换操作后,如果生产端服务有写入数据将会被覆盖。 当创建的站点复制对为“IDC”类型且复制类型为“V2C”时,暂不支持反向重保护操作。
  • 前提条件 24.6.0及之前版本,需要待反向重保护的容灾站点服务器已完成预配置,如果还未进行预配置,请参考配置容灾站点服务器进行配置。 24.9.0及之后版本支持自动配置容灾网关功能(即在反向重保护过程不再需要配置容灾站点服务器)。24.6.0及之前版本实现该功能,需要将网关及生产服务器的sdrs软件升级至24.9.0或之后版本,并参照配置云容灾网关重新配置网关。 保护组中保护实例状态为“切换完成”或者“反向重保护失败”。
  • 异步复制客户端的端口说明 表1 容灾网关端口说明 端口 协议 使用说明 29210 tcp 用于与代理客户端通信 29211 tcp 用于接收控制命令 7443 tcp 用于与API进行通信 表2 生产站点/容灾站点服务器端口说明 端口 协议 使用说明 8091 tcp 用于代理客户端内部消息转发 59526 tcp 用于与容灾网关通信 29210 tcp 本地监听,用于切换后与代理客户端通信 29211 tcp 本地监听,用于切换后接收控制命令 7443 tcp 本地监听,用于切换后与API进行通信 父主题: 附录
  • 操作场景 切换操作将以容灾站点最新的有效数据来创建云服务器,新创建的服务器按照云服务器相关标准计费。如果切换时待切换的服务器仍在运行,系统会将执行切换操作时刻之前的数据同步至容灾站点,持续写入的数据存在无法同步到容灾站点的风险。如果待切换的服务器出现故障无法同步,则可能会丢失部分数据。 切换完成后,数据不会自动反向同步(容灾站点到生产站点),保护实例处于停止保护状态,如需开始反向数据同步,需要进行反向重保护操作。 切换为高危操作,切换后将会在容灾端启动业务,需要用户保证生产端业务已经停止,否则可能造成生产端和容灾端同时接管业务或业务冲突从而造成数据破坏或业务中断,需要对容灾端数据进行验证和分析时建议用“容灾演练”功能。 在V2C场景的切换过程中,会临时创建一个后缀名为VMwareToCloud的系统转换E CS ,请勿对该ECS进行任何操作,否则可能会导致切换失败,切换完成后会自动删除该ECS。 开启网卡切换功能,生产站点服务器会被关机,状态变为“计划性关机”;若不开启网卡切换功能,生产站点服务器不会被关机,状态不变。 切换后,生产站点服务器不能继续提供业务,否则反向同步会将新写入的数据覆盖。
  • 操作场景 当生产站点可用区内的云服务器和云硬盘由于不可抗力导致物理环境故障时,可参考本章节执行故障切换操作,启用容灾站点可用区内的云服务器和云硬盘等资源,以确保业务正常运行。 如果启动故障切换,容灾站点的服务器和磁盘将立刻可用。您可上电服务器,或结合云服务器备份服务或云硬盘备份服务将数据恢复至您指定的具有应用一致性的数据恢复点。 故障切换时SDRS会对ECS的网卡进行迁移,切换后生产站点ECS的IP、EIP、MAC地址会迁移到容灾站点的ECS上,从而保持切换后和切换前ECS的IP、EIP、MAC地址保持不变。 启动故障切换的同时,数据同步停止。 故障切换完成后,保护组的状态变为“故障切换”,原容灾站点会变更为生产站点,此时需进入保护实例的详情页面将当前生产站点可用区的云服务器开机。 故障切换完成后,请勿对当前容灾站点可用区的云服务器(原生产站点,即故障端)进行开机操作,否则可能会导致重保护失败。 图1 故障切换
  • 升级步骤 以下操作以升级“24.9.0”版本的容灾网关“sdrs_xxxx_24.9.0.xxxx.tar.gz”为例。 获取云容灾网关软件包到待部署服务器的任意目录。 IDC上云:通过界面链接下载软件包,并上传到待部署的云容灾网关服务器; 跨区域和跨可用区:复制服务控制台页面提供的命令,登录待部署的云容灾网关服务器,进入任意目录,粘贴并执行命令获取软件包。 在软件包所在目录下,以“root”用户,执行以下命令,解压缩软件包。 tar -zxvf sdrs_xxxx_24.9.0.xxxx.tar.gz 执行以下命令,进入升级脚本所在目录。 cd sdrs_xxxx_24.9.0.xxxx.tar.gz 执行以下命令,升级云容灾网关软件。 sh upgrade.sh 回显中包含如下信息,说明云容灾网关升级成功: ... Upgrade SDRS successfully.
  • 前提条件 云容灾网关和代理客户端建议放在同一安全组内,安全组配置为仅允许安全组内弹性云服务器互通。 为保障服务正常运行,需要确保异步复制客户端的端口说明中的端口未被占用。 如果待安装代理客户端的服务器的防火墙已开启,需要放通59526端口的访问。 已安装云容灾网关,云容灾网关为24.9.0及更高版本。 已获取生产站点服务器的Administrator密码,需要安装的生产站点服务器均为Windows操作系统。 已手动安装一台Windows代理客户端,可参见安装代理客户端。 云容灾网关服务器、已安装的代理客户端和待安装的生产站点服务器网络互通,可通过ping命令检查。
  • 异常排查 如果界面回显“error: install SDRS timeout”,则表示脚本超时,在云容灾网关服务器上按照下述步骤排查: 根据回显信息“IP地址 install successfully”可通过以下命令查看到已成功安装代理客户端的生产站点服务器。 等待几分钟通过该命令查看是否有新增服务器出现,若有,则设置的超时时间太短,后台安装依然成功,由此可继续等待几分钟后查看剩下的服务器是否安装成功。。 /opt/cloud/sdrs/sidecar/script/cmd_tools.sh list 若上述步骤中依然查看不到对应的客户端,则查看windows-host-list.txt文件中的密码输入是否正确。
  • 操作场景 切换完成后,数据不会自动反向同步(容灾站点到生产站点),保护实例处于停止保护状态,如需开始反向数据同步,需要进行反向重保护操作。 执行反向重保护后,在初始同步过程中,如果容灾站点服务器重启,数据会重新进行同步,直到同步完成。 反向重保护时会将原生产站点服务器关机,状态变为“计划性关机”。 执行反向重保护后,初始同步完成,如果容灾站点服务器重启,数据不会重新进行同步。之后如果容灾站点服务器写入数据,数据增量同步。 反向重保护会将容灾站点服务器的数据覆盖原生产站点服务器数据,在执行切换操作后,如果生产端服务有写入数据将会被覆盖。 当创建的站点复制对为“IDC”类型且复制类型为“V2C”时,暂不支持反向重保护操作。
  • 前提条件 24.6.0及之前版本,需要待反向重保护的容灾站点服务器已完成预配置;如果还未进行预配置,保护实例将如下图所示无法进行操作,请参考配置容灾站点服务器进行配置。 24.9.0及之后版本支持自动配置容灾网关功能(即在反向重保护过程不再需要配置容灾站点服务器)。24.6.0及之前版本实现该功能,需要将网关及生产服务器的sdrs软件升级至24.9.0或之后版本,并参照配置云容灾网关重新配置网关。 保护实例状态为“切换完成”或者“反向重保护失败”。
  • 前提条件 保护组状态为“可用”、“保护中”、“故障切换”、“开启保护失败”、“停止保护失败”、“切换失败”、“故障切换失败”、“删除失败”、“重保护失败”。 当复制对状态为“可用”、“保护中”、“故障切换”、“创建失败”、“开启保护失败”、“停止保护失败”、“切换失败”、“故障切换失败”、“删除失败”、“重保护失败”、“挂载失败”、“扩容失败”、“无效”或者“故障”。 该复制对未被挂载到保护实例上。如何卸载,请参见卸载复制对。
  • 使用须知 创建容灾演练时,如果保护组内的生产站点服务器加入了企业项目,容灾演练创建的演练服务器不会自动加入到企业项目,如有需要请手动将演练服务器加入到企业项目。 创建容灾演练时,如果生产站点服务器为Linux云服务器且为密钥方式登录,创建容灾演练后,创建的容灾演练服务器详情不显示密钥对信息,但可以使用容灾站点服务器的密钥对登录容灾演练的服务器。 创建容灾演练成功后,生产站点服务器中的“主机名”、“名称”、“委托”、“云服务器组”、“自动恢复”、“安全组”和“标签”配置项修改不会再自动同步到演练服务器上。您可以登录控制台,手动将这些配置项的修改添加到演练服务器上。 容灾演练操作只在容灾演练服务器配置主网卡,如果生产站点有从网卡,容灾演练不会自动配置,需要在容灾演练服务器详情页面手工绑定从网卡。
  • 操作场景 在不影响业务的情况下,通过容灾演练,模拟真实故障恢复场景,制定应急恢复预案,检验容灾方案的适用性、有效性。当真实故障发生时,通过预案快速恢复,提高业务连续性。 存储容灾服务提供的容灾演练功能,在容灾演练VPC(该VPC不能与容灾站点服务器所属VPC相同)内执行容灾演练,基于容灾站点服务器的磁盘快照,快速创建容灾演练服务器。 当容灾演练服务器创建完成后,生产站点服务器和容灾演练服务器同时独立运行,数据不再实时同步。 在容灾演练过程中,会临时创建一个后缀名为VMwareToCloud的系统转换ECS,请勿对该ECS进行任何操作,否则可能会导致演练失败,切换或/容灾演练完成后会自动删除该ECS。 为保证在灾难发生时,容灾切换能够正常进行,建议您定期做容灾演练。
  • 操作步骤 以下操作以“24.9.0”版本的代理客户端“sdrs_xxxx_24.9.0.xxxx.tar.gz”为例。 登录云容灾网关以root权限执行以下卸载命令,批量卸载代理客户端。 /opt/cloud/sdrs/sidecar/script/cmd_tools.sh uninstall --ip=ip_list --timeout=cmd_timeout_in_s 参数说明: --ip:需要卸载的生产站点服务器私有ip列表,多个ip之间使用逗号分隔 --timeout:卸载命令执行超时时间,单位:秒。默认值:300,建议值:需要批量卸载的服务器数量*200(单台生产站点服务器卸载代理客户端的时间,若为Windows客户端则建议单台升级超时时间为300) 完整命令示例: /opt/cloud/sdrs/sidecar/script/cmd_tools.sh uninstall --ip=192.168.0.6,192.168.0.188,192.168.0.204 --timeout=600 当交互框出现确认提示框时,输入“y”继续执行卸载。 如果界面回显中包含“uninstall SDRS successfully”信息,则表示所有生产站点服务器卸载成功。
  • 操作步骤 以下操作以安装“24.9.0”版本的容灾网关“sdrs_xxxx_24.9.0.xxxx.tar.gz”为例。 获取云容灾网关软件包到待部署服务器的任意目录。 IDC上云:通过界面链接下载软件包,并上传到待部署的云容灾网关服务器; 跨区域和跨可用区:复制服务控制台页面提供的命令,登录待部署的云容灾网关服务器,进入任意目录,粘贴并执行命令获取软件包。 在软件包所在目录下,以“root”用户,执行以下命令,解压缩软件包。 tar -zxvf sdrs_xxxx_24.9.0.xxxx.tar.gz 执行以下命令,进入安装脚本所在目录。 cd sdrs_xxxx_24.9.0.xxxx 执行以下命令,安装云容灾网关软件。 sh install.sh --drm-ip=drm_ip --dra-ip=dra_ip --role=gateway 其中,“drm_ip”和“dra_ip”均为当前容灾网关服务器IP地址,可在弹性云服务器控制台界面获取,如下图所示。 回显中包含如下信息,说明云容灾网关安装成功: ... Installed DRM successfully. Installed SDRS successfully. ... 基于安全考虑,sdrs服务将在首次安装时随机生成自签证书用于组件间认证。 执行以下命令,查看云容灾网关进程是否已启动。 ps -ef | grep java | grep drm 回显如下类似信息: service 2089 1 5 10:25 ? 00:01:12 /opt/cloud/sdrs/drm/tools/jre/bin/java -Djava.security.egd=file:/dev/random -jar /opt/cloud/sdrs/drm/drm-24.9.0.jar --service.kernel.security.scc.config_path=file:/opt/cloud/sdrs/drm/classes/scc --spring.config.location=/opt/cloud/sdrs/drm/classes/application.properties 如果回显信息中“drm”进程存在,说明进程已启动。 执行以下命令,查看云容灾网关监听端口是否建立。 netstat -ano | grep 7443 安装完成后,将在软件包同级目录生成携带自签证书的安装包sdrs_xxxx_24.9.0.xxxx_with_certs.tar.gz和用于完整性校验的sha256文件sdrs_xxxx_24.9.0.xxxx.tar.gz_with_certs_sha256。请使用该安装包用于代理客户端的安装部署。 安装完成后,请参考配置云容灾网关进行配置操作。
  • 前提条件 云容灾网关建议起始规格为8U16G,操作系统只支持Linux,建议使用Huawei Cloud EulerOS 2.0或欧拉2.9/2.10,或参考支持的操作系统版本。 云容灾网关服务器所在的区域、可用区、VPC 需要和生产站点服务器保持一致。 云容灾网关和代理客户端建议放在同一安全组内,安全组配置为仅允许安全组内弹性云服务器互通。 为保障服务正常运行,需要确保异步复制客户端的端口说明中的端口未被占用。
  • 操作步骤 登录待配置的生产站点服务器。 依次执行以下命令,配置生产站点服务器代理客户端的网关地址。 Linux服务器: su - service -c "/opt/cloud/sdrs/hostagent/bin/agent_config.sh --drm-ip=drm ip --ha-ip=HostAgentIp" windows服务器: 打开cmd窗口执行以下命令:: C:\cloud\sdrs\hostagent\bin\agent_config.bat --drm-ip=drm ip --ha-ip=HostAgentIp drm ip:云容灾网关的主网卡IP地址 ; HostAgentIp: 本机的主网卡IP地址; 此生产站点配置的容灾网关必须和保护实例的容灾网关相同。
  • 操作场景 在不影响业务的情况下,通过容灾演练,模拟真实故障恢复场景,制定应急恢复预案,检验容灾方案的适用性、有效性。当真实故障发生时,通过预案快速恢复,提高业务连续性。 存储容灾服务提供的容灾演练功能,在容灾演练VPC(该VPC不能与容灾站点服务器所属VPC相同)内执行容灾演练,基于容灾站点的云硬盘快照,快速创建容灾演练服务器。 当容灾演练服务器创建完成后,生产站点服务器和容灾演练服务器同时独立运行,数据不再实时同步。 在容灾演练过程中,会临时创建一个后缀名为VMwareToCloud的系统转换ECS,请勿对该ECS进行任何操作,否则可能会导致演练失败,切换或/容灾演练完成后会自动删除该ECS。 为保证在灾难发生时,容灾切换能够正常进行,建议您定期做容灾演练。
  • 使用须知 创建容灾演练时,如果保护组内的生产站点服务器加入了企业项目,容灾演练创建的演练服务器不会自动加入到企业项目,如有需要请手动将演练服务器加入到企业项目。 创建容灾演练时,如果生产站点服务器为Linux云服务器且为密钥方式登录,创建容灾演练后,创建的容灾演练服务器详情不显示密钥对信息,但可以使用容灾站点服务器的密钥对登录容灾演练的服务器。 创建容灾演练成功后,生产站点服务器中的“主机名”、“名称”、“委托”、“云服务器组”、“自动恢复”、“安全组”和“标签”配置项修改不会再自动同步到演练服务器上。您可以登录控制台,手动将这些配置项的修改添加到演练服务器上。 容灾演练操作只在容灾演练服务器配置主网卡,如果生产站点有从网卡,容灾演练不会自动配置,需要在容灾演练服务器详情页面手工绑定从网卡。
  • 前提条件 已安装云容灾网关。若客户端为linux,云容灾网关为24.6.0及更高版本;若客户端为windows,则要求云容灾网关为24.9.0及更高版本。 需要日志收集的生产站点服务器已安装代理客户端,若生产站点服务器为Linux操作系统,代理客户端为24.6.0及更高版本,若生产站点服务器为Windows操作系统,代理客户端为24.9.0及更高版本。 收集的日志单个客户端的文件总大小暂时不支持超过400M。
  • 操作步骤 以下操作以“24.9.0”版本的代理客户端“sdrs_xxxx_24.9.0.xxxx.tar.gz”为例。 登录云容灾网关以root权限执行以下命令,批量收集日志。 /opt/cloud/sdrs/sidecar/script/cmd_tools.sh log --ip=ip_list --role=role 参数说明: --ip:需要日志收集的生产站点服务器私有ip列表,多个ip之间使用逗号分隔 --role:需要日志收集的进程角色,可选值:hostagent、drm、dra、sidecar、all 完整命令示例: /opt/cloud/sdrs/sidecar/script/cmd_tools.sh log --ip=192.168.0.6,192.168.0.188,192.168.0.204 --role=hostagent 如果界面回显“send cmd successfully”,则表示命令发送成功,可在/opt/cloud/sdrs/sidecar/tmp目录下查看收集的日志文件。命令异步执行,若立即查看日志文件不存在,可稍等2min后查看。
  • 操作场景 您可以为需要容灾的云硬盘创建复制对,并将其添加到指定的保护组中。保护组添加复制对时: 如果保护组的状态为“可用”,即停止保护状态,此时,生产站点和容灾站点磁盘只是建立复制对关系,数据并未同步。如需数据同步,请开启保护。 如果保护组的状态为“保护中”,即开启保护状态,此时,新添加复制对创建成功后,会自动开启数据同步。 复制对创建完成后,系统默认容灾站点磁盘名称与生产站点磁盘名称相同,但ID不同。 如果需要修改磁盘名称,请在复制对详情页面单击磁盘名称,进入磁盘详情页面进行修改。
  • 前提条件 当复制对的状态为“可用”、“保护中”或者“扩容失败”时才能进行扩容复制对操作。 扩容复制对之前请确认组成复制对的云硬盘状态为“可用”或者“正在使用”。 若组成复制对的云硬盘计费模式为包周期,则不允许扩容复制对。如果想增加复制对中云硬盘的容量,则需要先删除复制对,对生产站点云硬盘扩容后再重新创建新的复制对。 组成复制对的云硬盘为非共享云硬盘 当非共享云硬盘状态为“正在使用”时,且现网支持复制对在线扩容功能(如果现网不支持在线扩容功能,那么扩容按钮置灰),此时允许扩容复制对,否则不允许。 组成复制对的云硬盘为共享云硬盘 当共享云硬盘状态为“正在使用”时,共享云硬盘组成的复制对不支持在线扩容。
  • 前提条件 云容灾网关和代理客户端建议放在同一安全组内,安全组配置为仅允许安全组内弹性云服务器互通。 为保障服务正常运行,需要确保异步复制客户端的端口说明中的端口未被占用。 如果待安装代理客户端的服务器的防火墙已开启,需要放通59526端口的访问。 已安装云容灾网关,云容灾网关为24.6.0及更高版本。 已获取生产站点服务器的登录账号、端口、密码,需要安装的生产站点服务器均为Linux操作系统。 云容灾网关服务器和生产站点服务器网络互通,可通过ssh远程登录。 云容灾网关服务器已安装并支持expect命令。
  • 异常排查 如果界面回显“error: install SDRS timeout”,则表示脚本超时,在云容灾网关服务器上按照下述步骤排查: 执行以下命令检查云容灾网关服务器是否支持expect命令。 /bin/expect -v 根据回显信息“IP地址 install successfully”可查看到已成功安装代理客户端的生产站点服务器。对于未安装成功的服务器,检查linux-host-list.txt中远程安装的服务器用户名密码是否正确。执行以下命令并输入密码,查看是否能登录服务器。 /bin/ssh -t -p 端口 用户名@IP地址
  • 前提条件 云容灾网关建议起始规格为8U16G,操作系统只支持Linux,建议使用Huawei Cloud EulerOS 2.0或欧拉2.9/2.10,或参考支持的操作系统版本。 云容灾网关服务器所在的区域、可用区、VPC 需要和生产站点服务器保持一致。 云容灾网关和代理客户端建议放在同一安全组内,安全组配置为仅允许安全组内弹性云服务器互通。 由于安全要求,配置网关时使用的AK/SK账号需归属于当前使用SDRS服务的账号,否则将无法创建保护实例。 若24.6.0及之前的旧版本要实现自动配置容灾网关功能(即在反向重保护及重保护过程不再需要配置容灾站点和生产站点服务器),需要将网关及生产站点服务器的sdrs软件升级至24.9.0及之后版本,并按照如下“24.9.0及之后版本操作步骤”重新配置网关。
  • 前提条件 24.6.0及之前版本,需要待重保护的生产站点服务器已完成预配置,如果还未进行预配置,请参考配置生产站点服务器进行配置。 24.9.0及之后版本支持自动配置容灾网关功能(即在重保护过程不再需要配置生产站点服务器)。24.6.0及之前版本实现该功能,需要将网关及生产服务器的sdrs软件升级至24.9.0或之后版本,并参照配置云容灾网关重新配置网关。 保护组中保护实例状态为“切回完成”或者“重保护失败”。
共100000条