AI开发平台MODELARTS-示例:从0到1制作自定义镜像并用于训练(Horovod-PyTorch+GPU):场景描述

时间:2024-04-30 17:31:40

场景描述

本示例使用Linux x86_64架构的主机,操作系统ubuntu-18.04,通过编写Dockerfile文件制作自定义镜像。

目标:构建安装如下软件的容器镜像,并在ModelArts平台上使用CPU/GPU规格资源运行训练任务。

  • ubuntu-18.04
  • cuda-11.1
  • python-3.7.13
  • mlnx ofed-5.4
  • pytorch-1.8.1
  • horovod-0.22.1
support.huaweicloud.com/docker-modelarts/develop-modelarts-0143.html