云搜索服务 CSS-替换Elasticsearch集群指定节点:变更影响
变更影响
在替换指定节点前,您需要了解以下关键影响和操作建议,以便合理规划变更,最小化业务影响。
- 性能影响
替换指定节点不会中断业务,但是数据迁移会消耗IO性能,且替换过程中单节点下线可能影响集群性能。
建议在业务低峰期提高数据迁移速率以缩短任务耗时,并在业务高峰期前降低迁移速率以减轻对集群性能的影响。数据迁移速率由“indices.recovery.max_bytes_per_sec”参数决定,该参数值默认是“CPU核数 x 32MB”(如4核CPU默认128MB)。该参数取值范围为40MB至1000MB,可根据业务需求调整。PUT /_cluster/settings { "transient": { "indices.recovery.max_bytes_per_sec": "1000MB" } }
- 请求处理影响
节点替换过程中,发送到该节点的请求可能会失败。为了降低影响可以采用如下措施:
- 通过终端节点服务或独享型负载均衡器访问集群,确保请求自动路由到可用节点。
- 在客户端实现指数退避重试机制(建议配置3次重试)。
- 在业务低峰期进行规格变更。
- 变更过程特性
替换指定节点任务一旦启动就无法中止,直到任务成功或失败才会结束。任务失败通常只影响单个节点,在有副本的情况下业务不受影响,但需要及时修复失败节点。