服务公告
华为云ModelArts 系统pip源约束申明公告
2025-05-12
尊敬的华为云客户:
当您使用华为云ModelArts平台创建分布式训练作业时,如果您使用的节点数超过10个,系统将自动清除默认的pip源配置。该措施旨在避免训练过程中因多个节点同时访问pip 源,可能引发的网络瓶颈或依赖安装失败,确保训练作业的顺利进行。
【约束覆盖范围】
覆盖区域:华为云全部Region。
【约束影响】
在您使用华为云ModelArts平台在创建分布式训练作业时,如果您使用的节点数超过10个,系统将自动清除默认的pip源配置,当训练过程中涉及pip install操作时可能会训练失败。
建议在创建分布式训练作业时,提前安装所有的Python依赖,以此避免因节点数过多导致pip源配置被删除而引发训练失败,提升训练作业的稳定性和效率。
【常见问题】
如何避免系统自动删除pip源配置带来的影响:
为了避免每次作业启动时进行pip install,您可以在开发环境中提前打开镜像,并通过pip install安装好所有所需的依赖包。安装完成后,保存该镜像或者直接修改本地的Dockerfile来确保每次使用该镜像时依赖已经安装好。
如您有任何问题,可随时通过工单或者服务热线(4000-955-988或950808)与我们联系。
感谢您对华为云的支持!