期待怀揣梦想的你

加入我们,构筑华为云计算与网络的极致竞争力

华为云高速发展,已经在全球建设29 Regions,75 AZs,100+PoPs,2000+CDN边缘站点,覆盖170+国家和地区,规模快速增长,各行各业的业务日趋多样,给公有云的计算和网络带来了极大的挑战。

计算上摩尔定律已经失效,但云级的软件、硬件、芯片的持续垂直整合可以给云带来新的摩尔定律,如何持续提升性价比延续云级摩尔定律?网络横向上边缘网络、DCI骨干、数据中心网络、虚拟网络端到端全场景覆盖,纵向上软件、硬件、芯片、数据端到端全栈可控,如何打造出梦想中的理想网络?如果你渴望成长,渴望挑战,这里有良师益友,这里有世界难题,欢迎你的加入。

欢迎同学们加入计算与网络创新Lab,咨询答疑请联系yangxuwei1@huawei.com

长期开放岗位

社招、高端招聘均可应聘下列岗位,不同级别在年限和技能等级上有不同要求

岗位名称

工作地点

岗位职责

技能要求

云网络高级研发工程师

北京/上海

1、负责大规模、高可用云网络的创新研究工作,如Netwoking for AI、网络架构设计、网络性能优化、网络控制器算法、网络智能运维算法、网络云服务孵化等工作;

2、具体研究解决云定义自动驾驶网络中一个或多个关键问题:

a、研究基于全网可编程设备的下一代自治网络,新型网络具备实时流感知、无损拥塞控制、在网计算多租户共享等核心能力;

b、研究面向AI大模型训练和推理的下一代云网络(通信库、协议、网络功能和光电拓扑架构;

c、研究如何利用数据和知识快速感知故障、定位问题和自愈;

d、研究如何基于网络意图和网络仿真进行事前网络验证。

1、具有面向AI大模型训练和推理的下一代云网络(通信库、协议、网络功能和光电拓扑架构)的研究经验;

2、熟悉常见的网络协议和网络服务、产品的工作原理,有相关的项目研究经验;

3、在网络可扩展性、性能、延时、可靠性、易用性、AI智能运维等任意关键特性上有持续深入的研究经验;

4、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题。

物理网络高级工程师

北京/上海

1、参与数据中心网络架构的创新,基于最新技术重构,优化数据中心网络架构,实现物理网络和虚拟网络解耦,降低数据中心网络成本,支撑云上不同业务对底层基础设施网络的各种要求;

2、参与基础设施网络SDN系统的设计和开发,基于最新技术对网络的SLA进行测量和感知,做到基础设施网络运维管理的精细化,可视化、自动化和智能化;

3、同各个业务部门紧密合作,将新技术进行成果转化,帮助业务部门提升竞争力。

1、熟悉路由、交换的工作原理,熟悉BGP/OSPF等常见路由协议,熟悉链路聚合、VLAN、二/三层转发等概念和原理;

2、熟悉SDN相关技术,最好有SDN相关系统的开发经验,有基础设施网络管控系统开发经验者优先;

3、熟悉数据中心网络架构,具备一定的网络架构设计能力,有数据中心光网络经验者优先;

4、有网络测量、故障诊断,流量调度经验者优先。

资源调度高级研发工程师

北京/上海

1、负责华为云数据中心资源管理调度的创新研究,为客户提供极致性价比、稳定、易用的云资源服务;

2、参与资源管理端到端的优化设计,从资源规划、资源池配置、资源调度、动态调整等各个阶段提升资源利用率;

3、通过数据的AI分析,挖掘资源使用的规律和趋势,制定对应的调度策略,实现削峰填谷;

4、通过软硬件联合优化手段,实现更优的性能以及QoS保障;

5、负责创新的资源产品和解决方案设计开发,跟踪业界前沿趋势,引入创新技术,推动产品技术创新。

1、熟练使用Java/Python/Go语言的一种或多种进行开发,熟悉该语言的基础框架和原理;

2、熟悉linux操作系统,以及常用命令,包括虚拟化、容器相关的cgroup、namespace等;

3、有分布式系统设计开发经验,熟练掌握并发编程调试、缓存、消息中间件等机制;

4、优秀的表达、沟通能力以及团队协作能力;

5、熟悉业界主要资源管理调度系统OpenStack/Yarn/Mesos/Kubernetes等的架构、关键技术、使用场景、优劣势等;有大规模集群资源管理系统架构设计、开发实战经验者优先;

6、熟悉数据中心集群资源规划、部署,了解异构硬件和多种计算业务者优先。

虚拟化高级研发工程师

北京/上海

1、负责Linux内核、虚拟化、容器等创新研究,构建更适合云原生应用的OS和虚拟化技术;

2、参与虚拟化平台的定制化需求开发,解决在Linux内核、虚拟化平台上遇到的性能和QoS保障问题;

3、参与新型硬件、异构硬件等虚拟化适配;

4、跟踪业界前沿趋势,引入创新技术,推动产品技术创新。

1、3年以上Linux内核/虚拟化或相关开发经验,熟悉云计算基本架构和原理,对云计算底层技术架构和虚拟化解决方案有较深的研究;

2、深入理解虚拟化的架构和工作原理, 熟悉KVM/Xen原理,掌握VirtIO、SRIOV基础知识,有CPU/Memory/IO等虚拟化开发及调试经验。至少有一个虚拟化领域专精,如设备直通、VirtIO、热迁移等;

3、精通编程语言,算法、数据结构基础良好,精通内核态编程, 并参与、主导或独立完成过底层模块研发。至少有一个Linux Kernel核心子系统专精,如内存管理,文件系统,网络,进程调度,Cgroup等;

4、精通Linux内核和虚拟化问题的分析定位,性能持续调优;

5、有新硬件的内核/虚拟化适配项目经验者优先,可以独立完成内核驱动、虚拟化功能的适配开发。

网络大脑高级研发工程师

北京/上海

1、基于华为公有云海量网络数据,利用AI技术提升华为云运维平台的智能化、自动化运行;

2、打通从故障预警、故障告警、告警聚合到故障处理和用户极致体验的智能决策系统的全栈开发;

3、基于性能容量的预警和流量智能调度,保障用户LSA。

1、精通常见网络协议,熟悉网络路由转发原理,具备3-5年以上网络模块相关研发运维经验;

2、3-5年系统架构设计、开发、运维的经验;熟悉Java、C或Go语言及相关组件和系统;

3、有丰富的运维开发经验,在异常检测、故障诊断和自愈、网络可视化方向有成功实践者优先;

4、熟悉常见的网络监控数据,了解各个指标的影响面,有运用多维关联分析经验优先。

网络大脑专家

北京/上海

1、负责下一代华为云网络智能运维系统的规划和设计工作,用软件和AI打造极致运维效率的公有云网络,保障客户实时在线;

2、理解内部运维团队和云客户对网络运维的需求,设计和建设完善的监控/告警/定位/决策/隔离/恢复等系统;

3、与学术界和工业界顶尖人才开展技术合作,利用业界的力量攻克关键难题,洞察关键技术创新机会。

1、具备大型网络实际运维系统设计和研发经验;

2、熟悉了解数据中心/骨干网/虚拟网络架构和相关的网络协议者优先;

3、具备较强的AI算法能力,有AI应用于网络运维领域设计和研发经验者优先;

4、具备业界Top公有云厂商网络AIOps领域经验者优先。

云网络高级研发工程师

工作地点

北京/上海

岗位职责

1、负责大规模、高可用云网络的创新研究工作,如Netwoking for AI、网络架构设计、网络性能优化、网络控制器算法、网络智能运维算法、网络云服务孵化等工作;

2、具体研究解决云定义自动驾驶网络中一个或多个关键问题:

a、研究基于全网可编程设备的下一代自治网络,新型网络具备实时流感知、无损拥塞控制、在网计算多租户共享等核心能力;

b、研究面向AI大模型训练和推理的下一代云网络(通信库、协议、网络功能和光电拓扑架构;

c、研究如何利用数据和知识快速感知故障、定位问题和自愈;

d、研究如何基于网络意图和网络仿真进行事前网络验证。

技能要求

1、具有面向AI大模型训练和推理的下一代云网络(通信库、协议、网络功能和光电拓扑架构)的研究经验;

2、熟悉常见的网络协议和网络服务、产品的工作原理,有相关的项目研究经验;

3、在网络可扩展性、性能、延时、可靠性、易用性、AI智能运维等任意关键特性上有持续深入的研究经验;

4、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题。

物理网络高级工程师

工作地点

北京/上海

岗位职责

1、参与数据中心网络架构的创新,基于最新技术重构,优化数据中心网络架构,实现物理网络和虚拟网络解耦,降低数据中心网络成本,支撑云上不同业务对底层基础设施网络的各种要求;

2、参与基础设施网络SDN系统的设计和开发,基于最新技术对网络的SLA进行测量和感知,做到基础设施网络运维管理的精细化,可视化、自动化和智能化;

3、同各个业务部门紧密合作,将新技术进行成果转化,帮助业务部门提升竞争力。

技能要求

1、熟悉路由、交换的工作原理,熟悉BGP/OSPF等常见路由协议,熟悉链路聚合、VLAN、二/三层转发等概念和原理;

2、熟悉SDN相关技术,最好有SDN相关系统的开发经验,有基础设施网络管控系统开发经验者优先;

3、熟悉数据中心网络架构,具备一定的网络架构设计能力,有数据中心光网络经验者优先;

4、有网络测量、故障诊断,流量调度经验者优先。

资源调度高级研发工程师

工作地点

北京/上海

岗位职责

1、负责华为云数据中心资源管理调度的创新研究,为客户提供极致性价比、稳定、易用的云资源服务;

2、参与资源管理端到端的优化设计,从资源规划、资源池配置、资源调度、动态调整等各个阶段提升资源利用率;

3、通过数据的AI分析,挖掘资源使用的规律和趋势,制定对应的调度策略,实现削峰填谷;

4、通过软硬件联合优化手段,实现更优的性能以及QoS保障;

5、负责创新的资源产品和解决方案设计开发,跟踪业界前沿趋势,引入创新技术,推动产品技术创新。

技能要求

1、熟练使用Java/Python/Go语言的一种或多种进行开发,熟悉该语言的基础框架和原理;

2、熟悉linux操作系统,以及常用命令,包括虚拟化、容器相关的cgroup、namespace等;

3、有分布式系统设计开发经验,熟练掌握并发编程调试、缓存、消息中间件等机制;

4、优秀的表达、沟通能力以及团队协作能力;

5、熟悉业界主要资源管理调度系统OpenStack/Yarn/Mesos/Kubernetes等的架构、关键技术、使用场景、优劣势等;有大规模集群资源管理系统架构设计、开发实战经验者优先;

6、熟悉数据中心集群资源规划、部署,了解异构硬件和多种计算业务者优先。

虚拟化高级研发工程师

工作地点

北京/上海

岗位职责

1、负责Linux内核、虚拟化、容器等创新研究,构建更适合云原生应用的OS和虚拟化技术;

2、参与虚拟化平台的定制化需求开发,解决在Linux内核、虚拟化平台上遇到的性能和QoS保障问题;

3、参与新型硬件、异构硬件等虚拟化适配;

4、跟踪业界前沿趋势,引入创新技术,推动产品技术创新。

技能要求

1、3年以上Linux内核/虚拟化或相关开发经验,熟悉云计算基本架构和原理,对云计算底层技术架构和虚拟化解决方案有较深的研究;

2、深入理解虚拟化的架构和工作原理, 熟悉KVM/Xen原理,掌握VirtIO、SRIOV基础知识,有CPU/Memory/IO等虚拟化开发及调试经验。至少有一个虚拟化领域专精,如设备直通、VirtIO、热迁移等;

3、精通编程语言,算法、数据结构基础良好,精通内核态编程, 并参与、主导或独立完成过底层模块研发。至少有一个Linux Kernel核心子系统专精,如内存管理,文件系统,网络,进程调度,Cgroup等;

4、精通Linux内核和虚拟化问题的分析定位,性能持续调优;

5、有新硬件的内核/虚拟化适配项目经验者优先,可以独立完成内核驱动、虚拟化功能的适配开发。

网络大脑高级研发工程师

工作地点

北京/上海

岗位职责

1、基于华为公有云海量网络数据,利用AI技术提升华为云运维平台的智能化、自动化运行;

2、打通从故障预警、故障告警、告警聚合到故障处理和用户极致体验的智能决策系统的全栈开发;

3、基于性能容量的预警和流量智能调度,保障用户LSA。

技能要求

1、精通常见网络协议,熟悉网络路由转发原理,具备3-5年以上网络模块相关研发运维经验;

2、3-5年系统架构设计、开发、运维的经验;熟悉Java、C或Go语言及相关组件和系统;

3、有丰富的运维开发经验,在异常检测、故障诊断和自愈、网络可视化方向有成功实践者优先;

4、熟悉常见的网络监控数据,了解各个指标的影响面,有运用多维关联分析经验优先。

网络大脑专家

工作地点

北京/上海

岗位职责

1、负责下一代华为云网络智能运维系统的规划和设计工作,用软件和AI打造极致运维效率的公有云网络,保障客户实时在线;

2、理解内部运维团队和云客户对网络运维的需求,设计和建设完善的监控/告警/定位/决策/隔离/恢复等系统;

3、与学术界和工业界顶尖人才开展技术合作,利用业界的力量攻克关键难题,洞察关键技术创新机会。

技能要求

1、具备大型网络实际运维系统设计和研发经验;

2、熟悉了解数据中心/骨干网/虚拟网络架构和相关的网络协议者优先;

3、具备较强的AI算法能力,有AI应用于网络运维领域设计和研发经验者优先;

4、具备业界Top公有云厂商网络AIOps领域经验者优先。

天才少年、博士后、博士招聘岗位

岗位名称

工作地点

研究方向

岗位职责

岗位要求

大模型系统分布式框架研究工程师(博士、天少)

北京/上海

大模型/MOE/AI基础设施/AI系统相关研究

面向为AI训推提供高性能云基础设施,实现大模型跨集群/AZ和跨异构卡大规模训练、训推协同,打破数据中心的“资源孤岛”,规划、设计和重构下一代云基础设施,主要存在以下几方面挑战:

1、 如何解决异构网络和异构NPU卡联合训练时的异构网络的通信算子优化、异构NPU卡的均衡优化等问题,实现算子、通信、系统端到端协同优化,存在挑战

2、 如何通过软硬协同等系统级优化,打造极致性能的矩阵计算算子、高性能网络通信算子、网算融合算子,实现基于最小的算子原子组成,打造乐高式的编排引擎,多层次的寻优实现高性能的pipeline编排,实现主流模型的快速适配与性能优化,存在挑战

3、 大规模的AI训练集群需要跨AZ的低时延网络通信、高速和确定性传输,如何通过系统架构层面、协议层面技术优化和突破,减少绕行,减少网关,减少转换,提升性能,降低成本;如何进行应用与网络协同设计,结合模型特征,掩藏长距面临网络时延等要求,实现抗弱网、抗拥塞算法等确定性网络传输技术,存在挑战

1、计算机科学、人工智能、分布式系统等相关专业;

2、熟悉大规模分布式计算、并行计算相关算法及框架;

3、具备扎实的系统、算法和编程基础;

4、熟悉常见的网络协议和AI高性能网络协议,有相关的网络性能优化研究有大规模AI集群、异构网络的通信算子优化、异构NPU卡的均衡优化等工程经验优先;

5、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题

大模型基础设施研究员(博士后)

上海

大模型/MOE/AI基础设施/AI系统相关研究

1、研究面向大模型训练和推理的下一代云网络(通信算子库、高性能传输协议、网络功能和光电拓扑)系统架构和高性能网络传输协议设计,打造高带宽、低时延、确定性的网络传输底座,构建跨集群、数据中心、地域的超大规模AI训练集群,构筑TOP级的业界竞争力;

2、面向下一代云基础设施,打造极致性能的矩阵计算算子、高性能网络通信算子、网算融合算子;基于最小的算子原子组成,打造乐高式的编排引擎,多层次的寻优实现高性能的pipeline编排,实现主流模型的快速适配与性能优化

3、识别弹性无损训练、异构网络、异构NPU卡的联合训练的核心问题,并能创新性的提出关键技术优化思路;通过AI技术趋势洞察、AI框架与系统优化、网算协同等技术,实现昇腾云系统端到端协同优化

1、计算机科学、人工智能、分布式系统等相关专业;

2、熟悉大规模分布式计算、并行计算相关算法及框架;

3、具备扎实的系统、算法和编程基础;

4、熟悉常见的网络协议和AI高性能网络协议,有相关的网络性能优化研究有大规模AI集群、异构网络的通信算子优化、异构NPU卡的均衡优化等工程经验优先;

5、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题

大模型系统分布式框架研究工程师(博士、天少)

工作地点

北京/上海

研究方向

大模型/MOE/AI基础设施/AI系统相关研究

岗位职责

面向为AI训推提供高性能云基础设施,实现大模型跨集群/AZ和跨异构卡大规模训练、训推协同,打破数据中心的“资源孤岛”,规划、设计和重构下一代云基础设施,主要存在以下几方面挑战:

1、 如何解决异构网络和异构NPU卡联合训练时的异构网络的通信算子优化、异构NPU卡的均衡优化等问题,实现算子、通信、系统端到端协同优化,存在挑战

2、 如何通过软硬协同等系统级优化,打造极致性能的矩阵计算算子、高性能网络通信算子、网算融合算子,实现基于最小的算子原子组成,打造乐高式的编排引擎,多层次的寻优实现高性能的pipeline编排,实现主流模型的快速适配与性能优化,存在挑战

3、 大规模的AI训练集群需要跨AZ的低时延网络通信、高速和确定性传输,如何通过系统架构层面、协议层面技术优化和突破,减少绕行,减少网关,减少转换,提升性能,降低成本;如何进行应用与网络协同设计,结合模型特征,掩藏长距面临网络时延等要求,实现抗弱网、抗拥塞算法等确定性网络传输技术,存在挑战

岗位要求

1、计算机科学、人工智能、分布式系统等相关专业;

2、熟悉大规模分布式计算、并行计算相关算法及框架;

3、具备扎实的系统、算法和编程基础;

4、熟悉常见的网络协议和AI高性能网络协议,有相关的网络性能优化研究有大规模AI集群、异构网络的通信算子优化、异构NPU卡的均衡优化等工程经验优先;

5、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题

大模型基础设施研究员(博士后)

工作地点

上海

研究方向

大模型/MOE/AI基础设施/AI系统相关研究

岗位职责

1、研究面向大模型训练和推理的下一代云网络(通信算子库、高性能传输协议、网络功能和光电拓扑)系统架构和高性能网络传输协议设计,打造高带宽、低时延、确定性的网络传输底座,构建跨集群、数据中心、地域的超大规模AI训练集群,构筑TOP级的业界竞争力;

2、面向下一代云基础设施,打造极致性能的矩阵计算算子、高性能网络通信算子、网算融合算子;基于最小的算子原子组成,打造乐高式的编排引擎,多层次的寻优实现高性能的pipeline编排,实现主流模型的快速适配与性能优化

3、识别弹性无损训练、异构网络、异构NPU卡的联合训练的核心问题,并能创新性的提出关键技术优化思路;通过AI技术趋势洞察、AI框架与系统优化、网算协同等技术,实现昇腾云系统端到端协同优化

岗位要求

1、计算机科学、人工智能、分布式系统等相关专业;

2、熟悉大规模分布式计算、并行计算相关算法及框架;

3、具备扎实的系统、算法和编程基础;

4、熟悉常见的网络协议和AI高性能网络协议,有相关的网络性能优化研究有大规模AI集群、异构网络的通信算子优化、异构NPU卡的均衡优化等工程经验优先;

5、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题

校招、实习生招聘岗位

岗位名称

工作地点

岗位职责

技能要求

软件开发工程师

北京/上海

1、负责公有云计算、网络的创新技术项目研发,完成业界最新技术的探索与产品转化,涵盖新服务孵化,原有服务架构升级,性能优化等多个方面;

2、跟踪洞察业界最新技术发展方向,完成技术分析与原型验证相关工作。

1、熟练使用Python/Java/C/C++/Go等语言中一种及以上者优先;

2、熟悉TCP/IP等常见网络协议,熟悉网络路由转发原理,具备网络知识基础者优先;

3、具有计算、网络、虚拟化、云计算、资源调度、Linux内核等一种及以上知识者优先;

4、有较强求知欲,具备良好学习能力者优先。

AI工程师

北京/上海

1、对海量云上资源监控数据进行ML建模分析,通过离线训练建立云上负载特征模型,提供线上系统基于这些资源使用趋势和特征做出合理的决策;

2、通过机器学习方法动态感知网络故障和质量变化,主动绕过拥塞链路及优化用户公网访问路径;

3、对海量的网络运维KPI、日志等原始数据,通过大数据平台结合AI算法,实现网络故障的及时发现,对资源类的指标通过算法预测,做到故障预警,保障网路高可用的达成;

4、负责网络数字孪生化,算法支撑网络异常判断、根因分析、自动化变更;

5、从运维流程、产品手册、故障手册提取运维知识;

6、结合用户请求数据规律分析,优化资源调度策略,通过分支定界、强化学习等技术能力提升公有云资源利用率。

1、熟悉机器学习、深度学习、强化学习、运筹优化、AIOps、知识图谱、数据挖掘、NLP中一种及以上者优先;

2、熟悉Hadoop\Spark\Tensorflow\Pytorch中一种及以上者优先;

3、有较强求知欲,具备良好学习能力者优先。

软件开发工程师

工作地点

北京/上海

岗位职责

1、负责公有云计算、网络的创新技术项目研发,完成业界最新技术的探索与产品转化,涵盖新服务孵化,原有服务架构升级,性能优化等多个方面;

2、跟踪洞察业界最新技术发展方向,完成技术分析与原型验证相关工作。

技能要求

1、熟练使用Python/Java/C/C++/Go等语言中一种及以上者优先;

2、熟悉TCP/IP等常见网络协议,熟悉网络路由转发原理,具备网络知识基础者优先;

3、具有计算、网络、虚拟化、云计算、资源调度、Linux内核等一种及以上知识者优先;

4、有较强求知欲,具备良好学习能力者优先。

AI工程师

工作地点

北京/上海

岗位职责

1、对海量云上资源监控数据进行ML建模分析,通过离线训练建立云上负载特征模型,提供线上系统基于这些资源使用趋势和特征做出合理的决策;

2、通过机器学习方法动态感知网络故障和质量变化,主动绕过拥塞链路及优化用户公网访问路径;

3、对海量的网络运维KPI、日志等原始数据,通过大数据平台结合AI算法,实现网络故障的及时发现,对资源类的指标通过算法预测,做到故障预警,保障网路高可用的达成;

4、负责网络数字孪生化,算法支撑网络异常判断、根因分析、自动化变更;

5、从运维流程、产品手册、故障手册提取运维知识;

6、结合用户请求数据规律分析,优化资源调度策略,通过分支定界、强化学习等技术能力提升公有云资源利用率。

技能要求

1、熟悉机器学习、深度学习、强化学习、运筹优化、AIOps、知识图谱、数据挖掘、NLP中一种及以上者优先;

2、熟悉Hadoop\Spark\Tensorflow\Pytorch中一种及以上者优先;

3、有较强求知欲,具备良好学习能力者优先。

提示

您即将访问非华为云网站,请注意账号财产安全