-
概述 - 云运维中心 COC
概述 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端的演练流程; 承载华为云SRE在混沌演练上的最佳实践,使客户能对云上应用进行主动地风险识别、风险管理和消减,提升云应用的韧性。 父主题: 混沌演练
-
故障模式和演练任务的关系? - 云运维中心 COC
故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
-
全旅程混沌工程方案 - 云运维中心 COC
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的
-
应用场景 - 云运维中心 COC
AI加持风险评估:首创人员胜任力模型和OREO高危操作识别算法,AI加持消减作业风险。
-
什么是云运维中心 - 云运维中心 COC
风险评估:基于场景规则、流程规则、业务规则对变更进行管控,提前识别和拦截变更风险;通过变更日历实现变更冲突检测,降低服务间变更依赖导致的变更风险。 实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。
-
一站式资源运维 - 云运维中心 COC
OS合规性风险动态识别。
-
运维态势感知 - 云运维中心 COC
通过算法统计影响最严重的Top5事件单,快速识别重大故障场景。指标详情可查看表1。