招聘

云存储创新Lab精英招募,诚挚邀请各路精英加入,赋能华为云,与天才少年,顶级专家共同合作,实现云存储关键技术突破与竞争力的持续提升。有意向者请发送简历到招聘邮箱(dengyi22@huawei.com),与你相约。

高端招聘

诚邀业界专家加盟云存储创新Lab,带领团队持续突破创新,携手华为云乘风破浪,直挂云帆,打造全新一代云技术生态系统。

岗位

工作地点

岗位职能

首席技术专家&技术规划专家

首席技术专家&技术规划专家

深圳、上海、成都

首席技术专家&技术规划专家

1、负责云存储创新Lab产品和技术规划,洞察产业动态和技术发展趋势,制定技术战略,负责创新项目生命管理周期。

2、负责云存储创新Lab重大技术项目,核心方案设计和关键技术突破,对项目竞争力和业务成功负责。

首席技术专家&技术规划专家

工作地点

深圳、上海、成都

岗位职能

1、负责云存储创新Lab产品和技术规划,洞察产业动态和技术发展趋势,制定技术战略,负责创新项目生命管理周期。

2、负责云存储创新Lab重大技术项目,核心方案设计和关键技术突破,对项目竞争力和业务成功负责。

天才少年/博士招聘

天才少年、博士可应聘下列岗位,不同级别在技能等级上有不同要求

岗位

工作地点

岗位职能

任职要求

AI Infra高级工程师

AI Infra高级工程师

深圳、上海、成都

AI Infra高级工程师

  基于CloudMatrix384超节点,完成下一代跨集群/AZ以及Serverless训推架构创新和关键技术突破,为AI训推提供高性能云基础设施,构筑华为云全栈AI训练和推理系统竞争力,引领云的技术发展,加快普惠AI进程。

1、软硬协同等系统级优化,打造CloudMatrix384超节点硬件亲和极致性能的矩阵计算算子、高性能网络通信算子、网算融合算子,发挥极致CloudMatrix384超节点硬件优势;

2、下一代跨集群/AZ以及Serverless训推架构创新,基于最小的算子原子组成,打造乐高式的编排引擎,多层次的寻优实现高性能的pipeline编排,实现主流模型的快速适配与性能优化;

3、通过系统架构层面、协议层面技术优化和突破,减少绕行,减少网关,减少转换,提升性能,降低成本;应用与网络协同设计,结合模型特征,掩藏长距面临网络时延等要求,实现抗弱网、抗拥塞算法等确定性网络传输技术;

4、面向为AI训推提供高性能云基础设施,实现大模型跨集群/AZ和跨异构卡大规模训练、训推协同,打破数据中心的“资源孤岛”,参与规划、设计和重构下一代云基础设施;

5、面向应用、租户需求,研究大模型高速集群网络资源调度系统,提供优化连接,保证应用体验;研究方向包括集群内/间异构资源高性能动态互联,多租户隔离;多网元管控复杂度屏蔽;通过系统级调度保证整体可靠性、可用性等。

AI Infra高级工程师

1、计算机科学、人工智能、分布式系统等相关专业;

2、熟悉大规模分布式计算、并行计算相关算法及框架;具备扎实的系统、算法和编程基础;

3、具备扎实的系统、算法和编程基础;

4、熟悉常见的网络协议和AI高性能网络协议,有相关的网络性能优化研究有大规模AI集群、异构网络的通信算子优化、异构NPU卡的均衡优化等工程经验优先;

5、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题。

AI Infra高性能研发高级工程师

AI Infra高性能研发高级工程师

深圳、上海、成都

AI Infra高性能研发高级工程师

1、设计并落地大模型推理集群调度、弹性伸缩与资源隔离方案;

2、设计并优化推理框架;

3、设计并优化推理高阶特型比如PD分离、KV-Cache管理、序列并行/专家并行;

4、设计并优化面向华为CloudMatrix AI超节点的推理优化技术点。

AI Infra高性能研发高级工程师

1、计算机科学、人工智能、分布式系统等相关专业,有顶会最佳论文,ICPC等顶级竞赛金牌优先;

2、深度理解CUDA/Ascend kernel、通信协议(NCCL/HCCl/RDMA)与GPU/NPU内存层次结构;

3、熟悉vLLM、TensorRT-LLM、Triton或自研推理框架的源码与调优方法;

4、良好的代码能力(C++/Python),乐于推进跨团队协作。

AI算法高级工程师

AI算法高级工程师

深圳、上海、成都

AI算法高级工程师

1、负责LLM、SFT、RLHF、DPO等后训练流水线与自动化调参平台;

2、负责分布式加载、梯度累计、Checkpoint管理的系统优化;

3、负责设计面向华为CloudMatrix AI超节点的后训练系统方案。

AI算法高级工程师

1、计算机科学、人工智能、分布式系统等相关专业,有顶会最佳论文,ICPC等顶级竞赛金牌优先;

2、熟悉DeepSpeed ZeRO、Megatron-LM、Flash-Attention等核心算法与实现;

3、理解PPO、ReFT、DPO等RL流程,对Reward Model/Actor/Critic有实战经验;

4、良好的代码能力(C++/Python),乐于推进跨团队协作。

AI Infra高级工程师

工作地点

深圳、上海、成都

岗位职能

  基于CloudMatrix384超节点,完成下一代跨集群/AZ以及Serverless训推架构创新和关键技术突破,为AI训推提供高性能云基础设施,构筑华为云全栈AI训练和推理系统竞争力,引领云的技术发展,加快普惠AI进程。

1、软硬协同等系统级优化,打造CloudMatrix384超节点硬件亲和极致性能的矩阵计算算子、高性能网络通信算子、网算融合算子,发挥极致CloudMatrix384超节点硬件优势;

2、下一代跨集群/AZ以及Serverless训推架构创新,基于最小的算子原子组成,打造乐高式的编排引擎,多层次的寻优实现高性能的pipeline编排,实现主流模型的快速适配与性能优化;

3、通过系统架构层面、协议层面技术优化和突破,减少绕行,减少网关,减少转换,提升性能,降低成本;应用与网络协同设计,结合模型特征,掩藏长距面临网络时延等要求,实现抗弱网、抗拥塞算法等确定性网络传输技术;

4、面向为AI训推提供高性能云基础设施,实现大模型跨集群/AZ和跨异构卡大规模训练、训推协同,打破数据中心的“资源孤岛”,参与规划、设计和重构下一代云基础设施;

5、面向应用、租户需求,研究大模型高速集群网络资源调度系统,提供优化连接,保证应用体验;研究方向包括集群内/间异构资源高性能动态互联,多租户隔离;多网元管控复杂度屏蔽;通过系统级调度保证整体可靠性、可用性等。

任职要求

1、计算机科学、人工智能、分布式系统等相关专业;

2、熟悉大规模分布式计算、并行计算相关算法及框架;具备扎实的系统、算法和编程基础;

3、具备扎实的系统、算法和编程基础;

4、熟悉常见的网络协议和AI高性能网络协议,有相关的网络性能优化研究有大规模AI集群、异构网络的通信算子优化、异构NPU卡的均衡优化等工程经验优先;

5、有开阔的视野,能够快速吸收业界新技术,有挑战精神敢于做的更好,脚踏实地解决现实问题。

AI Infra高性能研发高级工程师

工作地点

深圳、上海、成都

岗位职能

1、设计并落地大模型推理集群调度、弹性伸缩与资源隔离方案;

2、设计并优化推理框架;

3、设计并优化推理高阶特型比如PD分离、KV-Cache管理、序列并行/专家并行;

4、设计并优化面向华为CloudMatrix AI超节点的推理优化技术点。

任职要求

1、计算机科学、人工智能、分布式系统等相关专业,有顶会最佳论文,ICPC等顶级竞赛金牌优先;

2、深度理解CUDA/Ascend kernel、通信协议(NCCL/HCCl/RDMA)与GPU/NPU内存层次结构;

3、熟悉vLLM、TensorRT-LLM、Triton或自研推理框架的源码与调优方法;

4、良好的代码能力(C++/Python),乐于推进跨团队协作。

AI算法高级工程师

工作地点

深圳、上海、成都

岗位职能

1、负责LLM、SFT、RLHF、DPO等后训练流水线与自动化调参平台;

2、负责分布式加载、梯度累计、Checkpoint管理的系统优化;

3、负责设计面向华为CloudMatrix AI超节点的后训练系统方案。

任职要求

1、计算机科学、人工智能、分布式系统等相关专业,有顶会最佳论文,ICPC等顶级竞赛金牌优先;

2、熟悉DeepSpeed ZeRO、Megatron-LM、Flash-Attention等核心算法与实现;

3、理解PPO、ReFT、DPO等RL流程,对Reward Model/Actor/Critic有实战经验;

4、良好的代码能力(C++/Python),乐于推进跨团队协作。

校园招聘

研究生、本科生、实习生均可应聘下列岗位,不同级别在技能等级上有不同要求

岗位

工作地点

岗位职能

任职要求

分布式存储研发工程师 & 大数据开发工程师

分布式存储研发工程师 & 大数据开发工程师

深圳、上海、成都

分布式存储研发工程师 & 大数据开发工程师

1、负责云计算分布式存储领域系统技术方案的设计、开发等工作。

2、负责项目开发过程中的技术攻关及解决运行中出现的技术问题。

3、负责产品核心模块的代码编写以及协助测试人员完成模块测试。

4、探索云服务化实现的前沿技术,并负责华为云大数据服务的架构设计、开发、测试及运维。

分布式存储研发工程师 & 大数据开发工程师

1、计算机、软件相关专业本科及以上学历,熟悉常用算法和数据结构,熟悉网络编程,多线程编程技术等;

2、有软件开发项目经验,并至少熟练掌握以下语言中的一种:C/C++/Python/等编程语言及脚本语言;

3、熟悉分布式系统设计原理,有分布式存储系统开发以及应用大数据组件的实战经验者优先;

4、具备团队意识,与他人合作良好,最好具有团队协作的经验。

AI软件开发工程师

AI软件开发工程师

深圳、上海、成都

AI软件开发工程师

1、负责AI领域的软件工程化和产品开发。

2、负责AI算法及系统的设计和实现,包括但不限于:路径规划、智能决策、推荐系统、大模型、生成式AI等。

3、负责产品的集成和调测,以及各类工具链的开发。

4、负责对外洞察AI领域最新趋势,包括但不限于:大模型,生成式AI,AI for coding等。

AI软件开发工程师

1、计算机相关专业,独立承担过关键子模块的开发工作,熟练运用至少一门编程语言(C/C++ /Python等)。

2、熟悉Tensorflow/MindSpore/pytorch等主流深度学习框架的使用,具备AI算法开发及应用经验者优先。

3、深入理解计算机系统架构与操作系统,熟练掌握异构计算平台原理和典型硬件加速器的使用方法,熟练运用并发编程和底层调试,熟悉Linux/ROS。

4、针对算法特点与芯片硬件特点设计最佳算法实现方式并优化部署或者有数据分析、挖掘、建模等方面的背景优先。

分布式存储研发工程师 & 大数据开发工程师

工作地点

深圳、上海、成都

岗位职能

1、负责云计算分布式存储领域系统技术方案的设计、开发等工作。

2、负责项目开发过程中的技术攻关及解决运行中出现的技术问题。

3、负责产品核心模块的代码编写以及协助测试人员完成模块测试。

4、探索云服务化实现的前沿技术,并负责华为云大数据服务的架构设计、开发、测试及运维。

任职要求

1、计算机、软件相关专业本科及以上学历,熟悉常用算法和数据结构,熟悉网络编程,多线程编程技术等;

2、有软件开发项目经验,并至少熟练掌握以下语言中的一种:C/C++/Python/等编程语言及脚本语言;

3、熟悉分布式系统设计原理,有分布式存储系统开发以及应用大数据组件的实战经验者优先;

4、具备团队意识,与他人合作良好,最好具有团队协作的经验。

AI软件开发工程师

工作地点

深圳、上海、成都

岗位职能

1、负责AI领域的软件工程化和产品开发。

2、负责AI算法及系统的设计和实现,包括但不限于:路径规划、智能决策、推荐系统、大模型、生成式AI等。

3、负责产品的集成和调测,以及各类工具链的开发。

4、负责对外洞察AI领域最新趋势,包括但不限于:大模型,生成式AI,AI for coding等。

任职要求

1、计算机相关专业,独立承担过关键子模块的开发工作,熟练运用至少一门编程语言(C/C++ /Python等)。

2、熟悉Tensorflow/MindSpore/pytorch等主流深度学习框架的使用,具备AI算法开发及应用经验者优先。

3、深入理解计算机系统架构与操作系统,熟练掌握异构计算平台原理和典型硬件加速器的使用方法,熟练运用并发编程和底层调试,熟悉Linux/ROS。

4、针对算法特点与芯片硬件特点设计最佳算法实现方式并优化部署或者有数据分析、挖掘、建模等方面的背景优先。