虚拟私有云和子网和Server资源的网络保持一致。 配置SNAT规则。 SNAT功能通过绑定弹性公网IP,实现私有IP向公有IP的转换,可实现VPC内跨可用区的多个云主机共享弹性公网IP、安全高效地访问互联网。
但是在生产环境或多人使用的公共服务器上,不建议设置TMOUT=0,关闭自动注销功能会带来一定的安全风险。 磁盘合并挂载。 开通Server资源后,服务器上可能会有多个未挂载的nvme磁盘。因此在首次配置环境前,需要完成磁盘合并挂载。
切换或重置Lite Server服务器操作系统 场景描述 Lite Server为一台裸金属服务器,您可以对Lite Server节点的操作系统进行切换或重置。
支持对昇腾服务器的带宽测试、算力测试、功耗测试、诊断压测等,为AI训练、推理等高负载场景提供硬件保障,同时可批量在多台服务器上均可并行,大幅度提升效率。 约束限制 当前仅支持Ascend Snt9b和Ascend Snt9b23节点。
key_pair_names 否 Array of strings 参数解释:SSH密钥对名称,可以在云服务器控制台(ECS)“密钥对”页面创建和查看。 约束限制:不涉及。
3 配置Lite Server软件环境 不同镜像中预安装的软件不同,您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。当Server服务器中预装的软件无法满足业务需求时,您可在Server服务器中配置所需要的软件环境。
更改SDI卡驱动 可能导致网卡不可用,导致服务器不可用,影响业务。 中 建议重置操作系统恢复,重置操作系统之前请确保您的数据已备份。 网络 修改网卡MAC地址或 IP地址 如果操作不当,会导致虚拟机通信异常、业务中断并且还会影响其他服务。 高 回退相关修改,如果回退失败。
配置Lite Server软件环境 NPU服务器上配置Lite Server资源软件环境 父主题: Lite Server资源配置
同时可批量在多台服务器上同时启动诊断任务,大幅度提升效率。 约束限制 当前仅支持Ascend Snt9b和Ascend Snt9b23节点。 创建任务的节点需要安装NodeTaskHub插件, 请在创建任务前确保插件安装完毕,具体参见安装Lite Server AI插件。
Lite Server资源管理 查看Lite Server服务器详情 启动或停止Lite Server服务器 同步Lite Server服务器状态 切换或重置Lite Server服务器操作系统 制作Lite Server服务器操作系统 Lite Server资源热备管理 修改Lite
Lite Server超节点定期压测 场景描述 针对超节点Snt9B23,支持用户定期对昇腾服务器进行性能测试和故障诊断,及时发现NPU故障,减少业务影响。 表1 性能测试 性能测试场景 场景说明 带宽测试 带宽测试主要用于测试总线带宽、内存带宽和总耗时。
5ad1df12-e3d2-4f36-b367-xxxxxxxxxxxx 节点名称/ID 发起事件的Server节点名称和服务器ID。 devserver-dd50 1e0d95ad-5a9f-46e3-9ba6-c5f8fcxxxx 事件类型 事件类型具体参见表1。
图2 插件运行中 插件安装完成后,即可在任务中心开展以下任务: 升级Lite Server中的昇腾驱动固件版本 Lite Server节点一键式压测 Lite Server节点故障诊断 父主题: Lite Server插件管理
父主题: Lite Server资源管理
AI插件,请通过安装Lite Server AI插件章节完成插件安装。
Lite Server资源使用 NPU日志收集上传 GPU日志收集上传
监控Lite Server资源 使用CES监控Lite Server单节点NPU资源 使用CES监控Snt9B23超节点健康状况
Lite Server使用前必读 Lite Server使用流程 Lite Server高危操作一览表 Lite Server算力资源和镜像版本配套关系
Lite Server资源配置 Lite Server资源配置流程 配置Lite Server网络 配置Lite Server存储 配置Lite Server软件环境
Lite Server插件管理 安装Lite Server AI插件 升级Lite Server中的昇腾驱动固件版本 Lite Server节点故障诊断 Lite Server节点一键式压测