强化学习--带来智能自主的未来世界

人工智能技术发展的前沿正在从感知智能向认知决策演进,强化学习通过与环境的交互,在探索中实现智能决策,是未来人工智能的基石。

强化学习能在系统维度高、动态复杂的情况下,可解决工业智能自动化与机器人控制等复杂问题,实现效率提升。

强化学习可通过相关的专业知识积累,帮助传统企业实现智能化升级。




我相信,从某种意义上讲,强化学习是人工智能的未来。——Richard Sutton

强化学习--带来智能自主的未来世界

游戏AI

2021年,随着游戏行业被写入了《“十四五”文化产业发展规划》,原本就热的游戏潮流将迎来百花齐放。游戏的虚拟性可以充分利用强化学习与环境交互学习的特性,从而加速游戏的测试流程,释放人力;同时也可以训练风格水平多样化的Bot和NPC,丰富游戏体验。ModelArts强化学习平台借助丰富的计算资源和雄厚的实战经验,助力游戏更AI。

工业4.0

目前工业4.0借助工业人工智能的发展与落地显著地改变了企业制造、运输、销售产品的方式,如何高效敏捷地建设智能工厂成为了企业未来建设的重点方向。

华为云计算借助ModelArts强化学习平台为智能工厂制造、运输、销售等流程提供高效、稳定、安全的决策支持,进一步为企业发展赋能,决胜未来。

云机器人

云机器人概念自2010被提出至现在,已迈过萌芽和商业服务阶段,目前软硬结合阶段的核心需求是快速迭代、端云协同和成本可控。ModelArts强化学习平台可以管理与机器人相关的多种数据,同时支持模型开发迭代和云部署、边缘部署的方式,可实现一站式机器人AI开发。

提供业界领先算法样例和框架

带动业务从自动化走向智能化

带动业务从自动化走向智能化

ModelArts依托产品化万核集群,提供了端云协同的强化学习模块化训练方案,可大幅降低定制成本。用户只需提供应用场景,订阅相关类型的解决方案,即可轻松实现需求。

  • 游戏
  • 异构训练集群、自主训练、多智能体、参数自调优。

  • 工业
  • 离线数据训练,在线探索安全机制,提升性能同时避免灾难。

  • 机器人
  • 感知-认知-决策全链路打通,端云协同。

  • 科研
  • 预置主流开源强化学习库、及主要Gym环境。

快速了解强化学习特性能力

异构计算集群

华为云异构高性能分布式训练支持海量CPU,GPU自由组合,提供大规模强化学习训练能力,支持弹性扩缩容及容错机制,方便用户使用IMPALA Seed等主流或客制化分布式架构进行高效的强化学习训练。兼顾多种应用场景,大幅度提高算法开发与训练效率。

  • 海量CPU、GPU自由组合
  • 弹性扩缩容
  • 包含容错机制
刑天

刑天是华为自研的高性能分布式强化学习框架,且已在GitHub开源,它为用户提供了一个高效的分布式框架,可以非常便捷的支持多实例采样和多卡训练,也内置了PPO,DQN,IMPALA等常用算法方便用户调用,同时对强化学习做了简单的抽象,方便用户在上面实现自己应用。

  • 高效的分布式框架
  • 灵活的模块化设计
  • 丰富的算法库
RL SDK

强化学习开发工具 RL SDK,基于ModelArts强化学习平台,提供端到端强化学习开发能力,包括环境自定义规范及接口验证、支持不同训练框架、云上训练推理及部署,帮助用户更快、更好地应用强化学习技术。

  • 端到端
  • 支持多种强化学习框架
  • 支持多种游戏接口验证

预置方案

更多方案,点击前往 AI Gallery >>

游戏方案


难点:状态复杂、动作空间巨大、游戏时间长

技术点:专家知识驱动、多模态融合、组合策略

MOBA类游戏
MOBA类游戏


难点:状态空间大、角色属性风格多样、实时性

技术点:自我博弈、优先级探索、专家知识驱动

ACT类游戏
ACT类游戏


难点:规则复杂、样本利用率低、非传递性问题

技术点:自我博弈、纳什规划、分布式集群

博弈类游戏
博弈类游戏
工业方案


根据玻璃窑内实时状态和成品质量优化燃料使用情况,

稳定产品质量,提升生产效率

玻璃窑炉
玻璃窑炉


基于现存水泥成分与生产工艺条件合理设置生产参数,

以实现能耗优化

水泥生产
水泥生产


根据原料质量和炉内实时状态优化炼钢工艺参数,

以降低原料消耗,提升产品合格率

钢铁炼化
钢铁炼化
机器人方案


ModelArts上设计开发,下载部署,感知,认知、决策与控制闭环

行业机器人
行业机器人


清洁风能驱动的自动导航海洋观测机器人

海洋机器人
海洋机器人


全自动移动机器人感知环境信息,进行自主路径规划,并进行决策

移动机器人
移动机器人
其他方案


预置主流开源强化学习库及主要Gym环境

科学研究
科学研究


投资组合优化、交易策略优化 、微观策略优化

量化投资
量化投资


生成有价值的小分子,辅助药物筛选

药物设计
药物设计

客户案例

左右滑动可查看更多案例

在智能工厂巡检场景中,ModelArts RL与”绝影”四足机器狗云端协同处理工厂火情。火情危机处理存在三大挑战:一是复杂工况下识别火焰;二是让机器狗像人一样理解当前存在火灾三是机器狗根据实时火情避开火焰按下灭火按钮。通过检测模型实时端侧部署、知识图谱在线服务调用、在线强化学习训练切换路径三大手段赋予”绝影”四足机器狗感知、认知与决策AI能力,成功灭火。

“绝影”机器狗

在智能工厂巡检场景中,ModelArts RL与”绝影”四足机器狗云端协同处理工厂火情。火情危机处理存在三大挑战:一是复杂工况下识别火焰;二是让机器狗像人一样理解当前存在火灾三是机器狗根据实时火情避开火焰按下灭火按钮。通过检测模型实时端侧部署、知识图谱在线服务调用、在线强化学习训练切换路径三大手段赋予”绝影”四足机器狗感知、认知与决策AI能力,成功灭火。

展开详情

与合作伙伴合作,训练高速动作类游戏。AI对战预置bot 达到100%胜率。在easy/difficult模式下对人类达到50%/90%胜率。AI具有多种不同风格,涵盖激进型、保守型、平衡型等多种打法,以丰富玩家体验。

高速动作类游戏

与合作伙伴合作,训练高速动作类游戏。AI对战预置bot 达到100%胜率。在easy/difficult模式下对人类达到50%/90%胜率。AI具有多种不同风格,涵盖激进型、保守型、平衡型等多种打法,以丰富玩家体验。

通过多模态数据融合方法整合玻璃产线传感器监测信息,并使用离线强化学习方法实现专家级别的生产控制策略。在不降低产能的情况下,进一步利用在线强化学习方法持续优化玻璃窑生产策略,实现窑炉的生产过程的节能降耗、稳定产品质量和提升生产效率,显著优于专家策略。

玻璃窑炉

通过多模态数据融合方法整合玻璃产线传感器监测信息,并使用离线强化学习方法实现专家级别的生产控制策略。在不降低产能的情况下,进一步利用在线强化学习方法持续优化玻璃窑生产策略,实现窑炉的生产过程的节能降耗、稳定产品质量和提升生产效率,显著优于专家策略。

扫描二维码填写相关信息,华为云专家将为您提供专业解决方案

合作伙伴