检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ServerAliveInterval 3600 # 增加这个配置,单位是秒,每1h向服务端主动发个包 ServerAliveCountMax 3 # 增加这个配置,3次发包均无响应会断开连接 比如防火墙配置是2小时空闲就关闭连接,那客户端配置ServerAliveInterval小于2小时(比
-binary -in D:\modelarts-latest-py2.py3-none-any.whl.cms -inform DER -content D:\modelarts-latest-py2.py3-none-any.whl -noverify > ./test 本示例
list && \ apt-get update && \ apt-get install -y python3 python3-pip && \ pip3 install --trusted-host https://repo.huaweicloud.com -i https://repo
list && \ apt-get update && \ apt-get install -y python3 python3-pip && \ pip3 install --trusted-host https://repo.huaweicloud.com -i https://repo
xxx.com:443/data/3_1597649054631.jpg?AccessKeyId=RciyO7RHmhNTfOZVryUH&Expires=1606299474&Signature=anOLGOHPSrj3WXUHVc70tAxWlf4%3D", "metadata"
train_instance_count=2, script_interpreter="/home/ma-user/anaconda3/envs/PyTorch-1.4/bin/python", log_url=base_bucket_path
Integer 角色。可选值如下: 0:打标者 1:审核者 2:团队管理者 3:数据集拥有者 status Integer 标注成员的当前登录状态。可选值如下: 0:未发送邀请邮件 1:已发送邀请邮件但未登录 2:已登录 3:标注成员已删除 update_time Long 更新时间。 worker_id
Integer 角色。可选值如下: 0:打标者 1:审核者 2:团队管理者 3:数据集拥有者 status 否 Integer 标注成员的当前登录状态。可选值如下: 0:未发送邀请邮件 1:已发送邀请邮件但未登录 2:已登录 3:标注成员已删除 update_time 否 Long 更新时间。
请求参数 无 响应参数 状态码:200 表2 响应Header参数 参数 参数类型 描述 X-Request-Id String 链路追踪编号 表3 响应Body参数 参数 参数类型 描述 create_at Long 创建时间。 hps_cluster_id String 超节点集群网络ID。
请求参数 无 响应参数 状态码:200 表2 响应Header参数 参数 参数类型 描述 X-Request-Id String 链路追踪编号 表3 响应Body参数 参数 参数类型 描述 create_at Long 创建时间。 hps_cluster_id String 超节点集群网络ID。
0:已标注 1:未标注 2:全部 3:条件筛选 limit 否 Integer 指定每一页返回的最大条目数,取值范围[1,100],默认为10。 offset 否 Integer 分页列表的起始页,默认为0。 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型
问题现象3 NCCL信息中报出Got completion with error 12, opcode 1, len 32478, vendor err 129等通信信息时,说明当前网络不是很稳定。 解决方案3 可加入3个环境变量。 NCCL_IB_GID_INDEX=3: 使用RoCE
问题现象3 NCCL信息中报出Got completion with error 12, opcode 1, len 32478, vendor err 129等通信信息时,说明当前网络不是很稳定。 解决方案3 可加入3个环境变量。 NCCL_IB_GID_INDEX=3: 使用RoCE
JSON Array 样本列表。样本属性请见表3。 表3 sample样本属性 参数 参数类型 描述 source String 被标注对象的URI,支持OBS、HTTPS、Content。其中Content为文本内容,例如:“source”:“s3://path-to-jpg”,“source”:“content://I
notebook平台,Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。 场景:部署在线服务Predictor的推理预测 1 2 3 4 5 6 7 from modelarts.session import Session from modelarts.model import
是否必选 参数类型 说明 job_desc 是 String 对训练作业的描述,字符串的长度限制为[0, 256]。 响应消息 响应参数如表3所示。 表3 响应参数 参数 参数类型 描述 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。
是否为必选 参数类型 说明 job_desc 是 String 对可视化作业的描述,字符串的长度限制为[0,256]。 响应消息 响应参数如表3所示。 表3 响应参数 参数 参数类型 说明 is_success Boolean 请求是否成功。 error_code String 调用失败时的错误码,具体请参见错误码。
GMT+0800][INFO]Response body: {"count":3"total_count":0"models":[{"model id":"ca12cbdb-e7eb-4084-9ea3-36c0bd6axxxx","model name":"query_vec_recall_model_b"
详情页可以查看故障恢复详情,具体请参见训练作业重调度。 约束限制 为了避免无效重启训练作业,造成算力资源浪费,作业卡死重启最多支持连续重启3次。 开启作业卡死重启 开启作业卡死重启有2种方式:控制台设置或API接口设置。 控制台设置 在创建训练作业页面,开启“自动重启”开关,并同
{ "key" : "k2", "value" : "v2" }, { "key" : "k3", "value" : "v3" }, { "key" : "k4", "value" : "v4" } ] } 状态码 状态码