云容器引擎 CCE-如何配置Pod使用GPU节点的加速能力?:解答

时间:2023-11-01 16:18:15

解答

方案1:

建议您将集群中GPU节点的不可调度的污点去掉,以便GPU插件驱动能够正常安装,同时您需要安装高版本的GPU驱动。

如果您的集群中有非GPU的容器,可以通过亲和、反亲和策略将这个容器不调度到GPU节点上。

方案2:

建议您安装高版本的GPU驱动,通过kubectl更新GPU插件的配置,增加配置如下:

tolerations:- operator: "Exists"

增加该配置后,可以使GPU插件驱动能够正常安装到打了污点的GPU节点上。

support.huaweicloud.com/cce_faq/cce_faq_00196.html