Search_HUAWEI CLOUD

典型场景配置实践 - AI开发平台ModelArts

典型场景配置实践个人用户快速配置ModelArts访问权限配置ModelArts基本使用权限管理员和开发者权限分离给子账号配置查看所有Notebook实例的权限使用Cloud Shell登录训练容器不允许子账号使用公共资源池创建作业委托授权ModelArts云服务使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
管理模型训练作业 - AI开发平台ModelArts

管理模型训练作业查看训练作业详情训练作业流程可视化查看训练作业资源占用情况查看模型评估结果查看训练作业事件查看训练作业日志修改训练作业优先级使用Cloud Shell调试生产训练作业保存调试模式训练作业镜像复制、停止或删除训练作业管理训练容器环境变量查看训练作业标签

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

客户端须注意本地时间与时钟服务器的同步，避免请求消息头X-Sdk-Date的值出现较大误差。因为API网关除了校验时间格式外，还会校验该时间值与网关收到请求的时间差，如果时间差超过15分钟，API网关将拒绝请求。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
功能介绍 - AI开发平台ModelArts
功能介绍 - AI开发平台ModelArts

功能介绍 Standard功能介绍 MaaS大模型即服务平台功能介绍 Lite Cluster&Server介绍 AI Gallery功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍
访问在线服务支持的传输协议 - AI开发平台ModelArts

访问在线服务支持的传输协议使用WebSocket协议的方式访问在线服务使用Server-Sent Events协议的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
环境配置故障 - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ SSH偶现拒绝访问问题，报错：Not allowed at this time 父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

如果您使用的是自定义镜像导入的模型，请增大自定义镜像中所使用的web server的keep-alive的参数值，尽量避免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设置该值。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
Notebook提示磁盘空间已满 - AI开发平台ModelArts

处理方法查看虚拟机所使用的存储空间，再查看回收站文件占用内存，根据实际删除回收站里不需要的大文件。在Notebook实例详情页，查看实例的存储容量。执行如下命令，排查虚拟机所使用的存储空间，一般接近存储容量，请排查回收站占用内存。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。

帮助中心 > AI开发平台ModelArts > API参考 > 附录
VS Code手动连接Notebook - AI开发平台ModelArts

用户本地PC或服务器的操作系统中建议先安装Python环境，详见VSCode官方指导。创建一个Notebook实例，并开启远程SSH开发。该实例状态必须处于“运行中”，具体参见创建Notebook实例（默认页面）章节。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
ma-cli configure鉴权命令 - AI开发平台ModelArts

ma-cli configure鉴权命令鉴权信息说明在虚拟机及个人PC场景，需要配置鉴权信息，目前支持用户名密码鉴权（默认）和AK/SK鉴权；在使用账号认证时，需要指定username和password；在使用IAM用户认证时，需要指定account、username和password

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
Standard开发环境 - AI开发平台ModelArts

对于使用本地IDE的开发者，由于本地资源限制，运行和调试环境大多使用团队公共搭建的资源服务器，并且是多人共用，这带来一定的环境搭建和维护成本。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
如何关闭Mox的warmup - AI开发平台ModelArts

处理方法创建训练作业时，在“运行参数”中增加参数“variable_update=parameter_server”来关闭Mox的warmup。父主题： MoXing

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
Notebook专属预置镜像列表 - AI开发平台ModelArts

cmake cpp curl ffmpeg g++ gcc gfortran git git-lfs grep libcudnn7 libcudnn7-dev libjpeg-dev:amd64 libjpeg8-dev:amd64 openssh-client openssh-server

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
训练作业找不到GP - AI开发平台ModelArts

处理方法根据报错提示，请您排查代码，是否已添加以下配置，设置该程序可见的GP： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GP编号，可以为0，1，2，3等，表明对程序可见的GP编号。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GP相关问题
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。适用于实时通信、在线游戏等需要双向实时通信的场景。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

转换后的jobstart_hccl.json文件格式（模板一）示例： { "server_count": "1", "server_list": [{ "device": [{ "device_id": "4", "device_ip": "192.1.10.254

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型 > 准备模型训练代码
配置Lite Cluster网络 - AI开发平台ModelArts

左侧单击“节点管理”，切换至“节点”页签，单击需要登录的节点名称，跳转至弹性云服务器详情页面。图2 节点管理在弹性云服务器详情页单击“弹性公网IP”，切换至“弹性公网IP”页签。单击“绑定弹性公网IP”，选择未绑定的弹性公网IP，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts Lite Cluster用户指南 > Lite Cluster资源配置
将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

步骤如下: 创建新的虚拟环境并保存到SFS目录克隆原有的虚拟环境到SFS盘重新启动镜像激活SFS盘中的虚拟环境保存并共享虚拟环境前提条件创建一个Notebook，“资源类型”选择“专属资源池”，“存储配置”选择“SFS弹性文件服务器”，打开terminal。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

RTT includes network transit time and server execution time. RTT is a good measurement for NFS latency.

帮助中心 > AI开发平台ModelArts > ModelArts Lite Cluster用户指南 > Lite Cluster资源管理 > 监控Lite Cluster资源

总条数： 244

上一页
1
...
8
9
10
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消