-
自建K8s集群迁移方案概述 - 云容器引擎 CCE
进行备份,并将数据打包上传至S3协议兼容的对象存储中,各类集群资源将以JSON格式文件进行存储。 目标集群应用恢复 在目标集群中进行还原时,Velero将指定之前存储备份数据的临时对象桶,并把备份的数据下载至新集群,再根据JSON文件对资源进行重新部署。 资源更新适配。 迁移后的
-
在k8s集群配置Ascend使用环境 - AI开发平台ModelArts
绑定完成后,通过MobaXterm、Xshell登录。以MobaXterm为例,填入弹性公网IP,登录节点。 图8 登录节点 方式2:通过华为云自带的远程登录功能 使用华为云账号登录CCE管理控制台。 在CCE集群详情页面,单击“节点管理”页签,在“节点”页签中单击需要登录的节点名称,跳转至弹性云服务器页面。
-
k8s Cluster简介 - AI开发平台ModelArts
k8s Cluster简介 ModelArts Lite k8s Cluster面向k8s资源型用户,提供托管式k8s集群,并预装主流AI开发插件以及自研的加速插件,以云原生方式直接向用户提供AI Native的资源、任务等能力,用户可以直接操作资源池中的节点和k8s集群。 图1
-
资源更新适配 - 云容器引擎 CCE
local 13s 数据库更新适配 本例中数据库为本地MySQL数据库,迁移后无需重新配置。若您通过数据复制服务DRS将本地数据库迁移至云数据库RDS,则在迁移后需重新配置数据库的访问,请您根据实际情况进行配置。 若云数据库RDS实例与CCE集群处于同一VPC下,则可通
-
配置外网访问(EIP) - AI开发平台ModelArts
配置外网访问(EIP) 弹性公网IP(Elastic IP,简称EIP)提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务。可以与弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡、NAT网关等资源灵活地绑定及解绑。集群资源绑定EIP后,外网用户可以通过EIP访问集群资源中的k8s
-
K8S静态采集器(app-discovery-k8s) - 迁移中心 MGC
K8S静态采集器(app-discovery-k8s) 用于采集k8s集群中的ingress,service,configMap等信息。参数配置说明参见表1。 表1 k8s静态采集器参数配置说明 参数 必填 配置说明 output_path 否 自定义采集结果(app-discovery-k8s-xxx
-
配置流程 - AI开发平台ModelArts
配置流程 图1 k8s Cluster资源配置流程图 表1 k8s Cluster资源配置流程 配置顺序 配置分类 配置任务 使用场景说明 是否必选操作 1 网络 配置外网访问(EIP) 外网用户通过EIP访问集群资源中的k8s master。 必选。(二选一) 配置外网访问(NAT)
-
k8s Cluster资源购买 - AI开发平台ModelArts
类。 K8S标签:设置附加到Kubernetes对象(比如Pod)上的键值对。最多可以添加20条标签。使用该标签可区分不同节点,可结合工作负载的亲和能力实现容器Pod调度到指定节点的功能。 污点:默认为空。支持给节点加污点来设置反亲和性,每个节点最多配置20条污点。 安装后执行脚
-
存储 - AI开发平台ModelArts
存储 容器中挂载存储 父主题: k8s Cluster资源配置
-
kubectl工具配置 - AI开发平台ModelArts
kubectl工具配置 本文介绍如何配置kubectl工具,操作步骤如下。 进入专属资源池。 图1 专属资源池页签 单击创建的专属资源池,进入专属资源池详情页面。 图2 专属资源池详情 单击对应的CCE集群,进入CCE集群详情页面,在“集群信息”找到“连接信息”。 图3 链接信息
-
k8s Cluster资源配置 - AI开发平台ModelArts
k8s Cluster资源配置 配置流程 在k8s集群配置Ascend使用环境 网络 存储 kubectl工具配置 容器镜像 日志监控 父主题: 弹性集群k8s Cluster
-
网络 - AI开发平台ModelArts
网络 配置外网访问(EIP) 创建相同帐户下的VPC对等连接 配置外网访问(NAT) 父主题: k8s Cluster资源配置
-
日志监控 - AI开发平台ModelArts
theus查看监控数据 使用ModelArts监控自定义指标 如何在AOM上查看ModelArts所有监控指标? 父主题: k8s Cluster资源配置
-
k8s Cluster资源使用 - AI开发平台ModelArts
k8s Cluster资源使用 风险操作 在lite资源池上使用Snt9B完成分布式训练任务 在Lite资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 在lite资源池上使用Snt9B完成推理任务 节点管理 节点池管理 标签 AI诊断 节点故障定位 调整容器引擎空间大小
-
K8S conntrack采集器(app-discovery-k8s-conntrack) - 迁移中心 MGC
p-discovery-k8s-conntrack\config\rules.properties 须知: 建议使用采集器提供的默认规则文件进行采集,如果需要自定义采集规则,请在默认规则文件基础上进行修改。 timeout 否 单次采集持续时间,单位为s(秒),1<取值范围<pe
-
K8S pod网络采集器(app-discovery-k8s-pod-net) - 迁移中心 MGC
iscovery-k8s-pod-net\config\rules.properties 须知: 建议使用采集器提供的默认规则文件进行采集,如果需要自定义采集规则,请在默认规则文件基础上进行修改。 period 是 采集间隔时间,单位为s(秒)/m(分钟),1s<取值范围≤30m,取整数。
-
配置外网访问(NAT) - AI开发平台ModelArts
配置外网访问(NAT) NAT网关(NAT Gateway)提供公网NAT网关和私网NAT网关。公网NAT网关为VPC内的云主机提供SNAT和DNAT功能,可轻松构建VPC的公网出入口。私网NAT网关为VPC内的云主机提供网络地址转换服务,使多个云主机可以共享私网IP访问用户本地
-
容器镜像 - AI开发平台ModelArts
容器镜像 容器镜像拉取 镜像预热 父主题: k8s Cluster资源配置
-
k8s Cluster资源开通 - AI开发平台ModelArts
k8s Cluster资源开通 不同机型的对应的软件配套版本 k8s Cluster资源购买 父主题: 弹性集群k8s Cluster
-
退订资源池 - AI开发平台ModelArts
退订资源池 针对不再使用的k8s Cluster资源,可以释放资源,停止计费相关介绍请见停止计费。 专属资源池资源释放后不可恢复,请谨慎操作。 登录ModelArts管理控制台。 在左侧导航栏中,选择“专属资源池 > 弹性集群”,进入“弹性集群”列表页面。 在弹性集群列表中,单击操作列的“更多