-
使用
对象存储服务 OBS作为存储 如果使用OBS服务作为存储方案,推荐使用“并行文件系统+obsutil”的方式,并行文件系统是OBS服务提供的一种经过优化的高性能文件语义系统,提供毫秒级别访问时延,TB/s级别带宽和百万级别的IOPS。obsutil是一款用于访问管理对象存储服务(Object Storage Service,OBS)的命令行工具,您可以使用该工具对OBS进行常用的配置管理操作,如创建桶、上传文件/文件夹、下载文件/文件夹、删除文件/文件夹等。对于熟悉命令行程序的用户,obsutil在执行批量处理、自动化任务场景能为您带来更优体验。 在OBS服务控制台上创建并行文件系统,具体步骤请参考创建并行文件系统。 针对您的操作系统,下载对应版本的obsutil至Lite Server服务器,并完成安装,具体步骤请参考下载和安装obsutil。 使用obsutil之前,您需要配置obsutil与OBS的对接信息,包括OBS终端节点地址(Endpoint)和访问密钥(AK和SK)。获得OBS的认证后,才能使用obsutil执行OBS桶和对象的相关操作,具体步骤请参考初始化配置。 配置完成后,您可以通过命令行的方式在Server服务器中对OBS的文件进行上传下载等操作,关于命令行介绍请参考命令行结构。
-
使用弹性文件服务SFS作为存储 如果使用SFS服务作为存储方案,推荐使用SFS Turbo文件系统。SFS Turbo提供按需扩展的高性能文件存储,还具备高可靠和高可用的特点,支持根据业务需要弹性扩容,且性能随容量增加而提升,可广泛应用于多种业务场景。 在SFS服务控制台上创建文件系统,具体步骤请参考创建SFS Turbo文件系统。同一区域不同可用区之间文件系统与云服务器互通,因此保证SFS Turbo与Server服务器在同一区域即可。 当创建文件系统后,您需要将该文件系统挂载至Server服务器上,具体步骤请参考挂载NFS协议类型文件系统到云服务器(Linux)。 为避免已挂载文件系统的云服务器重启后,挂载信息丢失,您可以在云服务器设置重启时进行自动挂载,具体步骤请参考服务器重启后自动挂载指南。
-
GP Lnt002弹性云服务器支持的镜像详情 镜像名称:Ubuntu-22.04-server-64bit-with-Tesla-Driver-535.183.01-and-CUDA-12.2(仅限华北-北京四、华东-上海一、中东-利雅得、亚太-雅加达) 软件类型 版本详情 操作系统 Ubuntu 20.04 server 64bit 内核版本 5.15.0-92-generic 架构类型 x86 驱动版本 535.183.01 cuda 12.2 nv-container-toolkit 1.17.1 Docker 27.3.1
CES -Agent 2.7.3.t2 镜像名称:HCE2.0-x86-for-L2-NVIDIA-535-CUDA-12.2(仅限华北-北京四、华东-上海一、亚太-新加坡) 软件类型 版本详情 操作系统 Huawei Cloud EulerOS 2.0(x86_64) 内核版本 5.10.0-60.18.0.50.r865_35 架构类型 x86 驱动版本 535.183.01 cuda 12.2 nv-container-toolkit 1.13.5-1 Docker 18.09.0 CES-Agent 2.6.7.1
-
GP Vnt1裸金属服务器支持的镜像详情 Vnt1规格在华北-北京四、华北-北京一和华东-上海一虽然规格相同,但是产品的配置、发布时间都存在很大差异,因此镜像不能共用。 镜像名称:Ubuntu-22.04-for-BareMetal-Vnt1-p3-with-NV-535-CUDA-12.2(仅限于华北-北京一、华北-北京四、华南-广州) 表7 镜像详情 软件类型 版本详情 操作系统 Ubuntu 22.04 内核版本 5.15.0-25-generic 架构类型 x86 驱动版本 535.54.03 cuda 12.2 container-toolkit 1.16.1-1 libnccl2 2.21.5-1+cuda12.2 libnccl-dev 2.21.5-1+cuda12.2 Docker 24.0.5 CES-agent 2.7.2.1 镜像名称:Ubuntu-18.04-for-BareMetal-Vnt1-p6-with-NV-470-CUDA-11.4-Uniagent(仅限于华东-上海一) 表8 镜像详情 软件类型 版本详情 操作系统 Ubuntu 22.04 内核版本 5.15.0-25-generic 架构类型 x86 驱动版本 545.23.08 cuda 12.3 nv-container-toolkit 1.17.4.1 libnccl-dev 2.21.5-1+cuda12.2 libnccl2 2.20.3-1+cuda12.3 Docker 28.0.0 CES-agent 2.7.5.1
-
GP Hnt02弹性云服务器支持的镜像详情 镜像名称:HCE2.0-x86-for-H20-NV-535-CUDA-12.2-v2(仅限华北-乌兰察布一、华东二) 软件类型 版本详情 操作系统 HCE 2.0 内核版本 5.10.0-182.0.0.95.r1941_123.hce2.x86_64 架构类型 x86_64 驱动版本 535.183.01 cuda 12.2 nv-fabricmanager 535.183.01 libnccl 2.18.5-1+cuda12.2 libnccl-dev 2.18.5-1+cuda12.2 CES-Agent 2.7.2.1 镜像名称:Ubuntu22.04_x86_for_h20_Driver-535-and-CUDA-12.2-v2(仅限华北-乌兰察布一、华东二) 软件类型 版本详情 操作系统 Ubuntu 20.04 server 64bit 内核版本 5.15.0-107-generic 架构类型 x86_64 驱动版本 535.183.01 cuda 12.2 nv-fabricmanager 535.183.01 libnccl2 2.18.5-1+cuda12.2 libnccl-dev 2.18.5-1+cuda12.2 Docker 28.0.1
-
GP Ant03弹性云服务器支持的镜像详情 镜像名称:Ubuntu 22.04 server 64bit with Tesla Driver 470.182.03 and CUDA 11.4(仅限华南-广州、华东-上海一) 软件类型 版本详情 操作系统 Ubuntu 22.04 server 64bit 内核版本 5.15.0-60-generic 架构类型 x86 驱动版本 470.182.03 cuda 11.4 nv-fabricmanager 470.182.03-1
-
NPU Snt9b弹性云服务器支持的镜像详情 镜像名称:HCE2.0-Arm-64bit-for-Snt9A2-E
CS -BareMetal-with-24.1.0.6-7.5.0.5.220-CANN8.0.1-v2 表4 镜像详情 软件类型 版本详情 操作系统 HCE2.0 内核版本 5.10.0-136.12.0.86.r1526_92.hce2.aarch64 架构类型 aarch64 固件版本 7.5.0.5.220 npu-driver 24.1.0.3 Ascend-cann-toolkit 8.0.1 cann-kernels 8.0.1 Ascend-mindx-toolbox 6.0.0 Docker 18.09.0 Ascend-docker-runtime v6.0.0 Mpich 3.2.1 MCU 23.3.16 CES-Agent 2.8.2.1 镜像名称:Ubuntu22.04-Arm-64bit-for-Snt9A2-ECS-BareMetal-with-24.1.0.6-7.5.0.5.220-CANN8.0.1-v2 表5 镜像详情 软件类型 版本详情 操作系统 Ubuntu 22.04 内核版本 5.15.0-91-generic 架构类型 aarch64 固件版本 7.5.0.5.220 npu-driver 24.1.0.3 Ascend-cann-toolkit 8.0.1 cann-kernels 8.0.1 Ascend-mindx-toolbox 6.0.0 Docker 26.0.0 Ascend-docker-runtime v6.0.0 Mpich 3.2.1 MCU 23.3.16 CES-Agent 2.8.2.1
-
GP Ant1裸金属服务器支持的镜像详情 镜像名称:Ubuntu-22.04-x86-for-Ant1-Ant8-BareMetal-with-RoCE-and-NVIDIA-550.90.07-CUDA-12.4-v2 表9 镜像详情 软件类型 版本详情 操作系统 Ubuntu 22.04 内核版本 5.15.0-25-generic 架构类型 x86 驱动版本 550.90.07 cuda 12.4 nv-fabricmanager 550.90.07-1 nv-container-toolkit 1.17.5-1 libnccl2 2.26.2-1+cuda12.4 libnccl-dev 2.26.2-1+cuda12.4 Docker 20.10.23 Mpich 4.1.5a1
-
GP Ant8裸金属服务器支持的镜像详情 镜像名称:Ubuntu-22.04-x86-for-Ant1-Ant8-BareMetal-with-RoCE-and-NVIDIA-550.90.07-CUDA-12.4-v2 表6 镜像详情 软件类型 版本详情 操作系统 Ubuntu 22.04 内核版本 5.15.0-25-generic 架构类型 x86 驱动版本 550.90.07 cuda 12.4 nv-fabricmanager 550.90.07-1 nv-container-toolkit 1.17.5-1 libnccl2 2.26.2-1+cuda12.4 libnccl-dev 2.26.2-1+cuda12.4 Docker 20.10.23 Mpich 4.1.5a1
-
NPU Snt3PD弹性云服务器支持的镜像详情 镜像名称:Huawei-Cloud-EulerOS-2.0-64bit-for-kAi2p-with-HDK-24.1.0.1-and-CANN-8.0.1 软件类型 版本详情 操作系统 Huawei Cloud EulerOS 2.0 内核版本 5.10.0-182.0.0.95.r2762_220.hce2.aarch64 架构类型 aarch64 npu-driver 24.1.0.1 Ascend-cann-toolkit 8.0.1 cann-kernels 8.0.1 Ascend-mindx-toolbox 6.0.0 Docker 18.09.0 Ascend-docker-runtime v6.0.0 Mpich 3.2.1 MCU 24.5.8
-
NPU Snt9b裸金属服务器支持的镜像详情 镜像名称:Ubuntu22.04-Arm-64bit-for-Snt9A2-BareMetal-with-24.1.0.6-7.5.0.5.220-CANN8.0.1-v2 表2 镜像详情 软件类型 版本详情 操作系统 Ubuntu 22.04 内核版本 5.15.0-91-generic 架构类型 aarch64 固件版本 7.5.0.5.220 npu-driver 24.1.0.3 Ascend-cann-toolkit 8.0.1 cann-kernels 8.0.1 Ascend-mindx-toolbox 6.0.0 Docker 26.0.0 Ascend-docker-runtime v6.0.0 Mpich 3.2.1 MCU 23.3.16 CES-Agent 2.8.2.1
-
NPU Snt9b23超节点服务器支持的镜像详情 镜像名称:HCE2.0-Arm-64bit-for-Snt9b23-with-25.2.1-7.7.0.9.220-CANN8.1.RC2-v2 表1 镜像详情 软件类型 版本详情 操作系统 HCE2.0 内核版本 5.10.0-182.0.0.95.r2220_157.hce2.aarch64 架构类型 aarch64 固件版本 7.7.0.9.220 npu-driver 25.2.1 Ascend-cann-toolkit 8.1.RC2 cann-kernels 8.1.RC2 Ascend-mindx-toolbox 7.0.RC1 Docker 27.2.0 Ascend-docker-runtime 7.0.RC1 Mpich 4.1.3 MCU 25.52.29 CES Agent 2.8.2.2
-
资源购买失败处理 ModelArts的轻量算力节点 (Lite Server)创建失败,可能由多种原因导致,以下给出了几类可能原因,方便快速排查和定位解决。 资源不足:跳转到BMS或ECS页面,查看要购买的规格是否售罄,如果该规格售罄,说明无该规格资源,需要联系客户经理获取到资源后再进行购买。 配额不足:查看账户的资源配额是否满足,如果该账号下资源配额,包括核心数、
RAM 等,如果未满足也会导致创建失败,需要申请配额后再进行购买。 BMS或ECS机器内部错误:查看BMS或ECS界面,创建失败出现内部错误,该问题需要提工单给BMS或ECS进行进一步定位失败原因并解决。
-
步骤3:开通基础权限 开通基础权限需要登录管理员账号,为子用户账号开通Lite Server功能所需的基础权限,包括ModelArts FullAccess、BMS FullAccess、ECS FullAccess、VPC FullAccess、VPC Administrator、VPCEndpoint Administrator、CloudMatrixFullAccessPolicy(超节点),即允许子用户账号同时可以使用这些云服务。 登录
统一身份认证 服务管理控制台。 单击目录左侧“用户组”,然后在页面右上角单击“创建用户组”。 填写“用户组名称”并单击“确定”。 在用户组页面,在目标用户组名称的操作列单击“用户组管理”,将需要配置权限的用户加入用户组中。 图2 用户组管理 单击用户组名称,进入用户组详情页。 在授权记录页签下,单击“授权”。 图3 “配置权限” 在搜索栏输入“ModelArts FullAccess”,并勾选“ModelArts FullAccess”。 图4 ModelArts FullAccess 以相同的方式,依次添加:BMS FullAccess、ECS FullAccess、VPC FullAccess、VPC Administrator、VPCEndpoint Administrator。(Server Administrator、DNS Administrator为依赖策略,会自动被勾选)。 单击“下一步”,授权范围方案选择“所有资源”。 单击“确定”,完成基础权限开通。
-
工具调用模型支持情况 模型名称 支持的tool choice DeepSeek-R1-0528 Auto Named DeepSeek-V3 Auto Named DeepSeek-V3.1 Auto Named DeepSeek-V3.2-Exp Auto DeepSeek-V3.2 Auto Named None Kimi-K2-128K Auto LongCat-Flash-Chat Auto Named None