文件结构如下所示 self-define-images/ --Dockerfile --test_app.py “Dockerfile” From ubuntu:18.04 # 配置华为云的源,安装 python、python3-pip 和 Flask RUN cp
workspaces Array of WorkspaceResponse objects 参数解释: workspace属性列表。 表5 WorkspaceResponse 参数 参数类型 描述 owner String 参数解释: 创建者名称。
表5 PoolMetaLabels 参数 参数类型 描述 os.modelarts/workspace.id String 参数解释:工作空间ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:0。
workspace_id String 参数解释:指定算法所处的工作空间,默认值为“0”。“0” 为默认的工作空间。 取值范围:不涉及。 ai_project String 参数解释:指定算法所属的ai项目,默认值为"default-ai-project"。
"name": "test-pytorch-cpu", "description": "test pytorch job in cpu in mode gloo", "create_time": 1641890623262, "workspace_id
部分故障模式通过华为云运维平台硬件告警监控发现,相关的故障定义和处理建议如表2所示。同时,这类故障产生时默认会上报AOM事件,您可在AOM配置告警通知。
本示例使用华为开源镜像站提供的apt源,执行如下命令获取apt源文件。
表5 PoolMetaLabels 参数 参数类型 描述 os.modelarts/workspace.id String 参数解释:工作空间ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:0。
表6 PoolMetaLabels 参数 参数类型 描述 os.modelarts/workspace.id String 参数解释:工作空间ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:0。
workspace_id String 参数解释:工作空间ID。未创建工作空间时默认值为“0”,存在创建并使用的工作空间,以实际取值为准。 取值范围:不涉及。 feature String 参数解释:实例类别。
infer_type String 推理方式,取值包含: real-time:在线服务 batch:批量服务 edge: 边缘服务 workspace_id String 工作空间ID。
可选值如下: true:返回标签信息 false:不返回标签信息(默认值) workspace_id 否 String 工作空间ID。未创建工作空间时默认值为“0”,存在创建并使用的工作空间,以实际取值为准。
workspace_id String 参数解释:指定算法所处的工作空间,默认值为“0”。“0” 为默认的工作空间。 取值范围:不涉及。 ai_project String 参数解释:指定算法所属的ai项目,默认值为"default-ai-project"。
登录华为云管理控制台。 在顶部导航栏单击“资源 > 我的配额”,进入服务配额页面。 单击右上角“申请扩大配额”,填写申请材料后提交工单。 配额需大于需要开通的资源,且在购买开通前完成提升,否则会导致资源开通失败。
workspace_id String 参数解释:指定作业所处的工作空间。 取值范围:不涉及。 description String 参数解释:对训练作业的描述。 取值范围:不涉及。
Workspace UI 改进工作区用户界面,提供了更好的可视化效果和操作体验,增强界面友好性。 文件访问记录 支持查看最近打开和关闭文件,便于快速访问常用文件,提升工作效率。 键盘快捷键改进 改进键盘快捷键,提高操作的效率和便捷性。
Workspace UI 改进工作区用户界面,提供了更好的可视化效果和操作体验,增强界面友好性。 文件访问记录 支持查看最近打开和关闭文件,便于快速访问常用文件,提升工作效率。 键盘快捷键改进 改进键盘快捷键,提高操作的效率和便捷性。
workspace_id String 作业所处的工作空间,默认值为“0”。 ai_project String 作业所属的AI项目,默认值为"default-ai-project"。
表12 PoolMetaLabels 参数 参数类型 描述 os.modelarts/workspace.id String 参数解释:工作空间ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:0。
仅华为云版Volcano插件支持开启路由加速特性。 训练使用的Python版本是3.7或3.9,否则无法实现ranktable路由加速。 训练作业的任务节点数要大于或等于3,否则会跳过ranktable路由加速。建议在大模型场景(512卡及以上)使用ranktable路由加速。