服务公告

全部公告 > 产品公告 > 华为云ModelArts 系统pip源约束申明公告

华为云ModelArts 系统pip源约束申明公告

2025-05-12

尊敬的华为云客户:

当您使用华为云ModelArts平台创建分布式训练作业时,如果您使用的节点数超过10个,系统将自动清除默认的pip源配置。该措施旨在避免训练过程中因多个节点同时访问pip 源,可能引发的网络瓶颈或依赖安装失败,确保训练作业的顺利进行。 

【约束覆盖范围】

覆盖区域:华为云全部Region。

【约束影响】

在您使用华为云ModelArts平台在创建分布式训练作业时,如果您使用的节点数超过10个,系统将自动清除默认的pip源配置,当训练过程中涉及pip install操作时可能会训练失败。

建议在创建分布式训练作业时,提前安装所有的Python依赖,以此避免因节点数过多导致pip源配置被删除而引发训练失败,提升训练作业的稳定性和效率。

【常见问题】

如何避免系统自动删除pip源配置带来的影响:

为了避免每次作业启动时进行pip install,您可以在开发环境中提前打开镜像,并通过pip install安装好所有所需的依赖包。安装完成后,保存该镜像或者直接修改本地的Dockerfile来确保每次使用该镜像时依赖已经安装好。

如您有任何问题,可随时通过工单或者服务热线(4000-955-988或950808)与我们联系。

感谢您对华为云的支持!