天才少年招聘 公有云站点服务依赖关系智能识别分析
公有云站点服务依赖关系智能识别分析
领域方向:智能运维
职位名称: 智能运维专家
公有云站点服务依赖关系智能识别分析
  • 智能运维
  • 智能运维专家

挑战课题方向简介

研究价值:

华为云XXX+云服务,管理面百万级节点,千万级微服务进程,已形成亿级复杂网状依赖关系,无法确定性的保障现网高可用,现有运维能力与人力投入面临巨大挑战;构建高性能(us时延)、低资源消耗(<3%CPU)、精准(99.999%)关系获取能力,生成全网依赖视图,支撑故障分钟级快速恢复、服务可用性精准评估、站点风险提前预测与消减等运维业务,提升运维质量与效率,使华为云稳定可靠。

关键挑战:

1、高性能: XXX+云服务,管理面百万级节点,千万级进程,亿级网状依赖关系,X亿/秒网络请求;目前缺少高性能us级时延抓取技术(首包识别等),获取网络请求并完成计算分析,构建完整依赖关系;

2、低资源占用:抓取技术需运行在管理节点(虚机、裸机、容器等),挤占已有资源;节点已部署各类业务,平均XXX+进程,同时运行有各类检测脚本,均对资源极其敏感;如何做到资源最低占用,保证业务正常,技术挑战大;

3、非侵入式:云服务+中间件的微服务个数XXXX+,现网多版本运行,分布各管理节点,无法通过侵入手段置入监控能力并全网升级来覆盖,实现难度大;

4、精准关系获取:普通TCP/UCP调用连接、nginx/lvs连接、kafka/rabbitmq消息连接等XX+种类型,类型多且实现复杂,难以精准获取。

 

投递方式

邮箱发送到cloudrecruit@huawei.com,邮件标题及简历附件命名方式:天才少年招聘+姓名+学校+挑战课题方向。