Search_HUAWEI CLOUD

构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

表2 HTTP方法方法说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源，如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
分布式训练功能介绍 - AI开发平台ModelArts

它支持两种主要模式：单机多卡数据并行（DataParallel, DP）：在同一台服务器上使用多张GPU卡，通过数据并行的方式加速训练。适用于需要充分利用单台服务器多GPU资源的场景。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型 > 分布式模型训练
创建训练作业 - AI开发平台ModelArts

表3 config属性列表参数是否必选参数类型说明 worker_server_num 是 Integer 训练作业worker的个数。最大值请从查询作业资源规格接口返回的“max_num”值获取。 app_url 是 String 训练作业的代码目录。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
Standard模型训练 - AI开发平台ModelArts

使训练作业的创建更灵活、易用提供实验管理能力，用户通常需要调整数据集、调整超参等进行多轮作业从而选择最理想的作业，模型训练支持统一管理多个训练作业，方便用户选择最优的模型提供训练作业的事件信息（训练作业生命周期中的关键事件点）、训练日志（训练作业运行过程和异常信息）、资源监控（资源使用率数据）、Cloud

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
如何根据Cluster节点故障自动恢复业务 - AI开发平台ModelArts

如何根据Cluster节点故障自动恢复业务 AI服务器单点硬件故障不可避免，在大规模算力使用场景下，资源池规模越大存在硬件故障的可能性越高。当发生硬件故障时可能会影响节点上服务的正常运行。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

RTT includes network transit time and server execution time. RTT is a good measurement for NFS latency.

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > ModelArts Standard资源监控
ModelArts中常用概念 - AI开发平台ModelArts

ModelArts Lite Server和ModelArts Lite Cluster使用的都是专属资源池。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
更新训练作业参数 - AI开发平台ModelArts

worker_server_num 是 Integer 训练作业worker的个数，最大值请从查询作业资源规格接口获取。 app_url 是 String 训练作业的代码目录。如：“/usr/app/”。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
AI套件（NV GPU） - AI开发平台ModelArts

GPU节点：插件版本为2.0.0以下时，请执行以下命令： cd /opt/cloud/cce/nvidia/bin && ./nvidia-smi 插件版本为2.0.0及以上时，请执行以下命令： cd /usr/local/nvidia/bin && .

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > ModelArts Standard资源管理 > 管理Standard专属资源池插件
Standard Notebook - AI开发平台ModelArts

如何在ModelArts的Notebook或Lite Server环境里查看CANN路径？

帮助中心 > AI开发平台ModelArts > 常见问题
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

表1 适用计费项计费项说明计算资源 ModelArts Standard专属资源池 ModelArts Lite Cluster资源池 ModelArts Lite Server资源池包括vCPU、GPU和NPU。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
创建训练作业参数 - AI开发平台ModelArts

worker_server_num 是 Integer 训练作业worker的个数，最大值请从查询作业资源规格接口获取。 app_url 是 String 训练作业的代码目录。如：“/usr/app/”。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
删除API - AI开发平台ModelArts
删除API - AI开发平台ModelArts

{endpoint}/v1/{project_id}/services/{service_id}/app-auth-apis/{api_id} 响应示例无状态码状态码描述 204 No Content 401 Unauthorized 403 Forbidden 500 Server

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
通过SSH工具远程使用Notebook - AI开发平台ModelArts

如果首次登录，PuTTY会显示安全警告对话框，询问是否接受服务器的安全证书。单击“Accept”将证书保存到本地注册表中。图6 询问是否接受服务器的安全证书成功连接到云上Notebook实例。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试
变更计费模式 - AI开发平台ModelArts

ModelArts Lite Server和Lite Cluster资源池不支持变更计费模式。操作步骤登录ModelArts控制台。

帮助中心 > AI开发平台ModelArts > 计费说明
Volcano调度器 - AI开发平台ModelArts

Deployment volcano-admission Webhook server端，负责Pod、Job等资源的校验和更改。

帮助中心 > AI开发平台ModelArts > ModelArts Lite Cluster用户指南 > Lite Cluster插件管理
Volcano调度器(Volcano Scheduler) - AI开发平台ModelArts

Deployment volcano-admission Webhook server端，负责Pod、Job等资源的校验和更改。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > ModelArts Standard资源管理 > 管理Standard专属资源池插件
创建训练作业版本 - AI开发平台ModelArts

表3 config属性列表参数是否必选参数类型说明 worker_server_num 是 Integer 训练作业worker的个数。最大值请从查询作业资源规格接口获取。 app_url 是 String 训练作业的代码目录。如：“/usr/app/”。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
文档导读 - AI开发平台ModelArts
文档导读 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK 介绍如何在本地安装ModelArts SDK。（可选）Session鉴权 Session模块的主要作用是实现与公有云资源的鉴权，并初始化ModelArts SDK Client、OBS Client。

帮助中心 > AI开发平台ModelArts > SDK参考
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

如果本地未安装SDK，可参考（可选）本地服务器安装ModelArts SDK安装；如果本地已安装，则无需再次安装。进行Session鉴权。可参见（可选）Session鉴权完成鉴权。鉴权完成后，即可开始使用。

帮助中心 > AI开发平台ModelArts > SDK参考

总条数： 244

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消