镜像保存中可能会影响查看实时日志,Cloud Shell连接可能中断,镜像保存后自动恢复。 父主题: 管理模型训练作业
基本原理 kubectl通过kubeconfig配置文件获取集群信息,从而与Kubernetes集群的API服务器进行通信。kubeconfig文件是kubectl访问Kubernetes集群的身份凭证,包含API Server地址、用户认证凭据和等配置信息。
Lite Server管理接口 表18 Lite Server管理接口 API 说明 查询用户所有DevServer实例列表 查询用户所有DevServer实例列表。 创建DevServer 创建DevServer。
下载完成后,将下载的vscode-server-linux-arm64.tar.gz文件重命名为“vscode-server-linux-x64.tar.gz”。
如果使用的是专业版的MobaXterm工具,请参考图3 设置“Stop server after”,此参数默认值为360s,将其设置为3600s或更大值。 图3 设置“Stop server after” 父主题: VS Code连接开发环境失败故障处理
后付费 按照云服务器实际使用时长计费。 计费周期 按订单的购买周期计费。 秒级计费,按小时结算。
续费 包年/包月云服务器在到期后会影响ModelArts作业的正常运行。如果您想继续使用ModelArts资源,需要在规定的时间内进行续费,否则资源将会自动释放,数据也可能会丢失。续费包括手动续费和自动续费两种方式,您可以根据需求选择。了解更多关于续费的信息,请参见续费概述。
原因分析 opencv的cv2.imshow在jupyter这样的client/server环境下存在问题。 而matplotlib不存在这个问题。 解决方法 参考如下示例进行图片显示。注意opencv加载的是BGR格式, 而matplotlib显示的是RGB格式。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。
Triton镜像中默认已存在id为1000的triton-server用户,需先修改triton-server用户名id后再增加用户ma-user,Dockerfile中执行如下命令。
def report2Aom(request,region): auth = cloud_utils.get_auth() #AK、SK和临时TOKEN值,系统会自动获取无需在代码中填写。
原因分析 TensorFlow多节点任务会启动parameter server(简称ps)和worker两种角色,ps和worker会被调度到相同的机器上。由于训练数据对于ps没有用,因此在代码中ps相关的逻辑不需要下载训练数据。
print('start') kv_store = mxnet.kv.create('dist_async') print('end') 原因分析 worker阻塞的原因可能是连不上server。
准备工作 准备一套可以连接外部网络,装有Linux系统并安装18.09.7及以上版本docker的虚拟机或物理机用作镜像构建节点,以下称“构建节点”。
轻量算力节点 (Lite Server):在ModelArts控制台“资源管理 > 轻量算力节点 (Lite Server)”页面中,在对应Server资源名称右侧,单击,选择“续费”,按照页面提示跳转到费用中心进行续费操作。
前提条件 已拥有需要部署SNAT的弹性云服务器。 待部署SNAT的弹性云服务器操作系统为Linux操作系统。 待部署SNAT的弹性云服务器网卡已配置为单网卡。
openssh-sftp-server openssl protobuf-compiler redis-server redis-tools rpm tar tofrodos unzip vim wget zip zlib1g-dev ...
连接远端开发环境时,一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上,如何解决?
典型场景配置实践 个人用户快速配置ModelArts访问权限 配置ModelArts基本使用权限 管理员和开发者权限分离 给子账号配置查看所有Notebook实例的权限 使用Cloud Shell登录训练容器 不允许子账号使用公共资源池创建作业 委托授权ModelArts云服务使用
管理模型训练作业 查看训练作业详情 训练作业流程可视化 查看训练作业资源占用情况 查看模型评估结果 查看训练作业事件 查看训练作业日志 修改训练作业优先级 使用Cloud Shell调试生产训练作业 保存调试模式训练作业镜像 复制、停止或删除训练作业 管理训练容器环境变量 查看训练作业标签