通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 表3 请求Body参数 参数 是否必选 参数类型 描述 grants 否 Array of grants objects 训练作业使用的数据集。
通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 表3 请求Body参数 参数 是否必选 参数类型 描述 quotas 是 Array of quotas objects 工作空间配额数据。
Notebook自定义镜像制作流程 图1 Notebook自定义镜像制作流程图(适用于场景一和场景二) 场景一:基于Notebook预置镜像或第三方镜像,在服务器上配置docker环境,编写Dockerfile后构建镜像并注册,具体案例参考在ECS上构建自定义镜像并在Notebook
复制生成的Token到编译构建服务即可。 Token生成后,请及时保存,下次刷新页面将无法读取,需要重新生成新Token。 注意填写有效的Token描述信息,避免误删除导致构建失败。 无需使用时及时删除Token,避免信息泄露。
配置完成后,子用户将被授予访问ModelArts资源的权限,从而能够正常使用训练管理、开发环境、数据管理、在线服务等功能。若管理员无权限操作或子用户不存在,接口将返回相应的错误信息。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。
通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 响应参数 状态码:200 表3 响应Body参数 参数 参数类型 描述 grants Array of grants objects 授权用户列表。默认为空。
基本原理 kubectl通过kubeconfig配置文件获取集群信息,从而与Kubernetes集群的API服务器进行通信。kubeconfig文件是kubectl访问Kubernetes集群的身份凭证,包含API Server地址、用户认证凭据和等配置信息。
docker save -o <tar文件名>.tar <镜像名称>:<标签> 示例: docker save -o my_image_v1.tar my_image:v1 将镜像上传至容器镜像服务SWR,用于后续训练作业。
如果用户使用的访问机器和华为云ModelArts服务的网络有隔离,则访问机器的外网地址需要在主流搜索引擎中搜索“IP地址查询”获取,而不是使用ipconfig或ifconfig/ip命令在本地查询。 图3 查询外网IP地址 父主题: 管理Notebook实例
取值范围:可选值如下: train:训练作业 infer:推理服务 notebook:Notebook作业 x-infer:新版推理作业 默认取值:不涉及。 status 否 String 参数解释:根据作业状态查询资源池作业列表。 约束限制:不涉及。
强制重部署会在节点重部署完成后进行节点重置,会导致服务器的本地盘数据和云盘数据全部丢失,请谨慎操作。
注册新镜像 构建完成后,将新镜像注册到ModelArts镜像管理服务中,进而能够在ModelArts中使用该镜像。 有两种方式来注册镜像。 方式一:使用ma-cli image register命令来注册镜像。
对于使用本地IDE的开发者,由于本地资源限制,运行和调试环境大多使用团队公共搭建的资源服务器,并且是多人共用,这带来一定的环境搭建和维护成本。
滚动升级是一种逐步替换实例的升级方式,适用于需要保持服务连续性的场景。通过分批次升级实例,确保在升级过程中始终有部分实例正常运行,从而减少停机时间。 滚动驱动升级时,驱动异常的节点对升级无影响,会和驱动正常的节点一起升级。
ntpd或者chronyd服务异常。 A050202 Runtime 其他 节点NotReady。
适合已经使用华为云SDK,熟悉云服务的用户。 支持在ModelArts控制台上直接查看的监控指标 支持在ModelArts管理控制台训练作业详情页中直接查看的监控指标请参见表1。 支持在ModelArts管理控制台总览页中查看的训练相关监控指标请参见表1。
滚动升级是一种逐步替换实例的升级方式,适用于需要保持服务连续性的场景。通过分批次升级实例,确保在升级过程中始终有部分实例正常运行,从而减少停机时间。 滚动驱动升级时,驱动异常的节点对升级无影响,会和驱动正常的节点一起升级。
5ad1df12-e3d2-4f36-b367-xxxxxxxxxxxx 节点名称/ID 发起事件的Server节点名称和服务器ID。 devserver-dd50 1e0d95ad-5a9f-46e3-9ba6-c5f8fcxxxx 事件类型 事件类型具体参见表1。
connectionStatus NetworkConnectionStatus object 参数解释:网络与其他云服务联通状态。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。
ntpd或者chronyd服务异常。 发起维修流程。 NT_KUBE_DISK_READONLY_CHECK Runtime 其他 Kubelet硬盘只读 以下目录只读: /mnt/paas/kubernetes/kubelet 发起维修流程。