检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU设备检查 功能 检查节点是否存在gpu设备,gpu驱动是否安装且运行正常。
应用GPU资源调度方式 IEF支持多应用共享的方式使用GPU显卡。 IEF支持单个应用使用多个GPU显卡。 GPU资源调度基于GPU显存容量,调度采用GPU显存预分配方式而非实时GPU显存资源。
安装并配置GPU驱动 背景信息 对于使用GPU的边缘节点,在纳管边缘节点前,需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至10.0版本对应的驱动。 操作步骤 安装GPU驱动。
安装并配置GPU驱动 背景信息 对于使用GPU的边缘节点,在纳管边缘节点前,需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至10.0版本对应的驱动。 操作步骤 安装GPU驱动。
如下图,请在注册边缘节点时根据型号选择“昇腾AI加速卡”。 启用昇腾AI加速卡的节点,在节点详情页可以查看到AI加速卡的信息,确认健康芯片列表。 NPU应用运行状态异常: 确定当前应用申请的昇腾AI加速卡个数不大于节点的健康芯片数量,否则应用会调度失败。
错误码说明 未检查到当前节点存在GPU设备 可能原因 GPU卡类型不匹配,当前IEF仅支持nvidia的GPU设备 GPU设备节点未检测到 处理措施 非nvidia的GPU卡。 安装IEF软件时,不使能GPU设备,或更换nvidia的GPU卡。 未检测到GPU设备。
边缘节点支持多个显卡,但是多个显卡的GPU型号必须相同。 当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,含有GPU硬件的机器作为边缘节点时可以不使用GPU。 父主题: 边缘节点
如果边缘应用需要使用NPU、GPU资源,请确认注册和纳管的边缘节点是否选择了对应的类型。 在边缘节点通过docker ps命令查看NPU、GPU容器(npu-device-plugin、gpu-device-plugin)是否正常运行。
如图1所示,填写边缘节点的名称,AI加速卡选择“Nvidia GPU”,不绑定终端设备。 图1 基本配置 如图2所示,为节点配置系统日志和应用日志。您可以自行选择是否开启云端日志(开启后,可在AOM服务中查看日志)。
表1 NPU类型说明 类型 描述 昇腾310 昇腾310芯片 昇腾310B 昇腾310B芯片 Nvidia GPU:如果您的边缘节点搭载了Nvidia GPU显卡,请选择“Nvidia GPU”。 不启用:边缘节点未使用AI加速卡时选择。
表1 NPU类型说明 类型 描述 昇腾310 昇腾310芯片 昇腾310B 昇腾310B芯片 Nvidia GPU:如果您的边缘节点搭载了Nvidia GPU显卡,请选择“Nvidia GPU”。 不启用:边缘节点未使用AI加速卡时选择。
systemctl stop edgecore systemctl stop edgedaemon 更换显卡,重新安装显卡驱动,然后拷贝驱动文件,具体请参见安装并配置GPU驱动文件。 启动边缘agent服务。
应用GPU资源调度方式 如何控制容器引擎占用磁盘空间大小? 容器应用访问异常如何解决? 昇腾AI加速卡(NPU)应用异常如何解决?
GPU驱动配置。 如果边缘节点使用GPU,您需要安装并配置GPU驱动,详细方法请参见安装并配置GPU驱动。 NPU驱动配置。 如果边缘节点使用昇腾AI加速处理器,请确保已安装对应驱动。 在边缘节点上安装Docker并检查Docker状态。
GPU驱动配置。 如果边缘节点使用GPU,您需要安装并配置GPU驱动,详细方法请参见安装并配置GPU驱动。 NPU驱动配置。 如果边缘节点使用昇腾 AI加速处理器,请确保已安装对应驱动。 在边缘节点上安装Docker并检查Docker状态。
如果边缘节点使用GPU,您需要在纳管前安装GPU驱动。 目前只有使用x86架构的GPU节点才能纳管到IEF中使用。 NPU(可选) 昇腾AI加速处理器。 说明: 当前支持集成了昇腾处理器的边缘节点,如Atlas 300推理卡、Atlas 800推理服务器。
如果边缘节点使用GPU,您需要在纳管前安装GPU驱动。 目前只有使用x86架构的GPU节点才能纳管到IEF中使用。 NPU(可选) 昇腾AI加速处理器。 说明: 当前支持集成了昇腾处理器的边缘节点,如Atlas 300推理卡、Atlas 800推理服务器。
如果边缘节点使用GPU,您需要在纳管前安装GPU驱动。 目前只有使用x86架构的GPU节点才能纳管到IEF中使用。 NPU(可选) 昇腾AI加速处理器。 说明: 当前支持集成了昇腾处理器的边缘节点,如Atlas 300推理卡、Atlas 800推理服务器。