多模态推理研究项目

致力于基于华为超节点CloudMatrix384打造秒级生成超长高分辨率视频和图片,创新定义下一代多模态推理框架,打造华为云多模态推理基础设施底座。

  • 推理框架

    推理框架涉及文生图、文生视频、文图生视频、图/视频文理解等方向,对其中关键技术超长Attention高性能计算、Cache以存代算、多样化推理调度、超节点并行等研究和探索。

    推理框架涉及文生图、文生视频、文图生视频、图/视频文理解等方向,对其中关键技术超长Attention高性能计算、Cache以存代算、多样化推理调度、超节点并行等研究和探索。

  • 推理模型

    在模型层面也对模型蒸馏、attn稀疏、量化技术有所关注和研究,始终保持对业界多模态最新技术的学习和研究,具备浓郁的学习、研讨氛围。

    在模型层面也对模型蒸馏、attn稀疏、量化技术有所关注和研究,始终保持对业界多模态最新技术的学习和研究,具备浓郁的学习、研讨氛围。