Serverless高性能强化学习系统研究项目

致力于研究和构建面向CloudMatrix384超节点架构下的高性能强化学习(RL)系统,打造高吞吐训练和工业级可靠性的RL训练引擎,成为华为云端AI基础设施的核心能力之一。

  • LLM模型和智能体训练调优

    自研分布式RL架构,结合CloudMatrix384大规模Scale-up通信域,通过异步任务执行框架与并行调度技术,提升训练吞吐量xx倍,解决业界普遍强化学习开销大、用时长的问题。易于扩展/替换不同的RL算法,为AI模型开发者提供易用、好用的平台。

    自研分布式 Agent协同,结合 CloudMatrix384 大规模 Scale-up 通信域,通过异步 DAG 执行与并行调度技术,将多 Agent 任务编排吞吐量提升 xx 倍,解决业界 Agent 协同复杂、延迟高的问题

  • Serverless RL

    面向云化大规模NPU计算资源和池化HBM,细粒度RL任务调度,训推共池调度,实现高效、灵活、弹性的Serverless RL训练,达成极致性价比。

    面向云化大规模NPU计算资源和池化HBM,细粒度RL任务调度,训推共池调度,实现高效、灵活、弹性的Serverless RL训练,达成极致性价比。