检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
/{job_id} cce:job:get √ √ 列出所有任务 GET /api/v2/projects/{project_id}/jobs cce:job:list √ √ 删除所有任务或删除单个任务 DELETE /api/v2/projects/{project_id}/jobs
有了这些驱动就可以使用EVS、SFS、OBS存储。
对象存储服务 支持ELB L7负载均衡 Windows集群支持EVS存储 裸金属场景支持devicemapper direct-lvm模式 v1.7.3-r8 主要特性: 集群支持节点弹性扩容 支持纳管ARM节点 v1.7.3-r7 主要特性: 容器隧道网络集群支持纳管SUSE 12sp2
对象存储服务 支持ELB L7负载均衡 Windows集群支持EVS存储 裸金属场景支持devicemapper direct-lvm模式 v1.7.3-r8 主要特性: 集群支持节点弹性扩容 支持纳管ARM节点 v1.7.3-r7 主要特性: 容器隧道网络集群支持纳管SUSE 12sp2
由于上传模板时创建OBS桶的命名规则由cce-charts-{region}-{domain_name}变为cce-charts-{region}-{domain_id},其中旧命名规则中的domain_name系统会做base64转化并取前63位,如果您在现有命名规则的OBS桶中找不到模板
约束与限制 PVC存储费用:当前只统计云硬盘(EVS)类型存储费用,不支持对象存储类型(OBS)、本地持久卷、文件存储类型(SFS)、极速文件存储(SFS Turbo)。 节点成本按照CPU、内存进行成本拆分,暂不支持GPU、NPU等异构资源的拆分。
创建存储 在新集群中使用已有存储创建PVC,PVC名称不变,方法请参见通过静态存储卷使用已有对象存储或通过静态存储卷使用已有极速文件存储。 切流方案仅支持OBS、SFS Turbo等共享存储。非共享存储切流需要将老集群内的工作负载暂停,将会导致服务不可用。
图1 亲和调度流程图 组调度(Gang):HyperJob支持组调度,即当Volcano Job运行数量满足minAvailable(不指定时为replicatedJobs.replicas之和)时,系统才会调度HyperJob。
"everest_image_version" : "2.1.30", "evs_url" : "*****", "iam_url" : "*****", "ims_url" : "*****", "obs_url
使用“对象存储”类型PVC(如OBS等)时,建议额外挂载“极速文件存储”类型PVC作为缓存,以加速模型加载速度。 极速文件存储PVC :用于缓存模型权重文件,提供低延迟访问,缩短模型加载时间。 创建对象存储类型的PVC,具体请参考通过静态存储卷使用已有对象存储。
AI大数据场景,创建vcjob时可指定minAvailable值,推荐配置enableJobStarving: true。 Volcano 1.11.5之前的版本enableJobStarving默认为true,1.11.5之后的版本默认配置为false。
例如,您可以在Recent jobs模块查看作业执行状况。 图1 Ray Dashboard 步骤四:删除相关资源。 删除Ray Cluster相关资源。
Linux x86:https://ucs-migration.obs.cn-north-4.myhuaweicloud.com/toolkits/image-migrator-linux-amd64 Linux arm:https://ucs-migration.obs.cn-north
Job成功策略(Beta) 在Kubernetes 1.31中,JobSuccessPolicy特性进阶至Beta。该特性允许用户基于成功的Pod个数为Job配置成功策略。详细使用方式请参考成功策略。
Job成功策略(Beta) 在Kubernetes 1.31中,JobSuccessPolicy特性进阶至Beta。该特性允许用户基于成功的Pod个数为Job配置成功策略。详细使用方式请参考成功策略。
表1 存储卷支持的访问模式 存储类型 ReadWriteOnce ReadWriteMany 云硬盘EVS √ × 文件存储SFS × √ 对象存储OBS × √ 极速文件存储SFS Turbo × √ 本地持久卷LocalPV √ × 专属存储DSS √ × 存储卷挂载方式 通常在使用存储卷时
ping test.obs.ap-southeast-1.myhuaweicloud.com 如果不能,则说明DNS无法解析该地址。
tiers: - plugins: - name: priority - enableJobStarving: false enablePreemptable: false name: gang
系统角色 拥有该权限的用户必须同时拥有以下权限: 全局服务:OBS Buckets Viewer、OBS Administrator。
对象存储等非本地存储。 可迁移至对象存储服务OBS等云存储服务。 迁移流程如图1所示,对于集群外资源您可根据实际需求进行选择性迁移。 图1 迁移方案示意图 迁移步骤 集群迁移大致包含如下6个步骤: 目标集群资源规划。