HUAWEI CLOUD EULEROS-安装并使用XGPU:约束限制

时间:2024-04-07 14:50:22

约束限制

  • XGPU功能仅在Nvidia Tesla T4、V100上支持。
  • HCE OS内核版本为5.10及以上版本。
  • GPU实例已安装535.54.03版本的NVIDIA驱动。
  • GPU实例已安装18.09.0-300或更高版本的docker。
  • XGPU服务的隔离功能不支持以UVM的方式申请显存,即调用CUDA API cudaMallocManaged(),更多信息,请参见NVIDIA官方文档。请使用其他方式申请显存,例如调用cudaMalloc()等。
  • 受GPU虚拟化技术的限制,容器内应用程序初始化时,通过nvidia-smi监测工具监测到的实时算力可能超过容器可用的算力上限。
  • 当CUDA应用程序创建时,会在GPU卡上申请一小部分UVM显存(在Nvidia Tesla T4上大约为3 MiB),这部分显存属于管理开销,不受XGPU服务管控。
  • 暂不支持同时在裸机环境以及该环境直通卡的虚拟机中同时使用
support.huaweicloud.com/usermanual-hce/hce_xgpu_0002.html