风险等级 高 关键策略 模拟AZ故障或Region故障场景,并基于容灾切换手册进行恢复演练 演练结束后,检查RPO/RTO指标是否符合预期;当不符合预期时,调整系统容灾方案,重新进行灾难演练 相关云服务和工具 MAS多活高可用服务灾难演练:支持同城跨AZ灾备/双活、两地三中心及异地多活等场景下的业务高可用容灾管理
相关云服务和工具 部署 CodeArts Deploy:提供可视化、自动化部署能力,提供丰富的部署步骤,有助于用户制定标准的部署流程,降低部署成本,提升发布效率。 微服务引擎 CSE:支持灰度发布。 应用服务网格 ASM:支持灰度发布。 父主题: RES15 升级不中断业务
选择合适的云服务,结合业务的特征选择合适的云服务类型和规格,利用好云弹性的特性的优势。
客户痛点: 业务部门较多,日志量较大,项目管理较为困难 云服务资源种类数量较多,监控指标和运维日志不熟悉,运维难度大 等保合规要求日志长时间存储,运维部门较多,人员不足,自建ELK成本高 解决方案: 业务价值: 全量日志接入:汽车APP、软件开发、流量平台等170个业务系统接入云日志服务
支持按不同维度进行故障检测,如Region、AZ、服务、方法、实例或容器ID等,检测维度与故障恢复方式对齐。 检测到故障后需及时告警或自动恢复。 针对具体故障进行检测时,根据检测的类型通常可以分为资源检测、功能检测和业务检测。
相关云服务和工具 应用性能管理 APM:支持调用链追踪,能够针对应用的调用情况,对调用进行全方面的监控,可视化地还原业务的执行路线和状态,协助性能及故障快速定位。 在查询后的调用链列表中,单击待查看的调用链的链接,查看该调用链基本信息。
华为云服务实例支持主动横向或纵向扩容功能;如对于ECS实例可以通过创建多个ECS实例实现横向扩容,也可升级ECS规格实现纵向扩容;对于RDS实例可升级RDS实例规格实现纵向扩容。 父主题: RES13 过载保护
华为云提供了MAS-CAST故障注入服务、CodeArts PerfTest性能测试服务、MAS多活高可用服务,可用于故障注入测试、压力负荷测试、长稳测试以及灾难演练。 父主题: RES11 可靠性测试
相关云服务和工具 云运维中心 COC:支持故障模式管理。 父主题: RES06 故障检测
建议:使用分布式的调用链技术,可以识别多个服务和组件之间请求链路;通过收集调用链数据实现数据流端到端的分析,产品阻塞瓶颈点或者效率低下的请求片段,从而进行针对性的优化。 相关云服务和工具 应用运维管理 AOM 应用性能管理 APM 云日志服务LTS 父主题: 性能数据采集
相关云服务和工具 IAM身份中心 IAM Identity Center 统一身份认证服务 IAM 应用身份管理服务 OneAccess 父主题: SEC02 身份认证
相关云服务和工具 LTS云日志服务:支持日志分析与数据转储 父主题: RES07 监控告警
相关云服务和工具 多活高可用服务 MAS 父主题: RES03 跨AZ容灾
相关云服务和工具 云日志服务 LTS 父主题: RES07 监控告警
相关云服务和工具 统一身份认证服务 IAM 父主题: SEC03 权限管理
相关服务和工具 客户可通过统一身份认证服务IAM的细粒度权限管理,精细化控制账号下用户的资源访问权限,实施最小授权。 对于多账号场景,客户可通过Organization的服务控制策略(Service Control Policy),集中控制每个账号可执行的操作。
相关云服务和工具 统一身份认证服务 IAM 组织 Organizations 企业管理 云审计服务 CTS 父主题: SEC02 身份认证
相关云服务和工具 企业主机安全 HSS 安全云脑 SecMaster 漏洞管理服务 CodeArts Inspector 父主题: SEC05 运行环境安全
相关云服务和工具: 优化顾问 OA 云监控服务 CES 应用运维管理 AOM 父主题: 性能看护
相关云服务和工具 多活高可用服务 MAS 父主题: RES04 跨Region/跨云容灾