AI开发平台ModelArts-使用自定义镜像创建的训练作业一直处于运行中:原因分析及处理办法
时间:2025-02-12 15:02:55
原因分析及处理办法
日志打印如下内容,表示自定义镜像的CPU架构与资源池节点的CPU架构不一致。
standard_init_linux.go:215: exec user process caused "exec format error"libcontainer: container start initialization failed: standard_init_linux.go:215: exec user process caused "exec format error"
常见场景为使用自定义镜像创建作业时选择的资源类型和规格错误。例如,自定义镜像是ARM CPU架构,应选用NPU规格的资源,却使用X86 CPU/X86 GPU规格的资源。
support.huaweicloud.com/trouble-modelarts/modelarts_trouble_0122.html