AI开发平台MODELARTS-Atlas800训练服务器硬件指南:Atlas 800训练服务器的网卡配置问题

时间:2024-04-30 19:22:38

Atlas 800训练服务器的网卡配置问题

  1. 机头网卡配置是什么?
    有以下两类网卡:
    • 四个2*100GE网卡,为RoCE网卡,插在NPU板。
    • 一个4*25GE/10GE,为Hi1822网卡,插在主板上的。
  2. ifconfig能看到的网卡信息吗

    能看到主板上的网卡信息,即VPC分配的私有IP。若要看RoCE网卡的命令需要执行“hccn_tools”命令查看,参考Atlas 800 训练服务器 1.0.11 HCCN Tool接口参考中的指导。

  3. NPU上的网卡在哪里可以看到, 会健康检查吗?

    8*NPU的网卡为机头上配置的四个2*100GE网卡。华为云有网卡健康状态监控机制。

support.huaweicloud.com/usermanual-modelarts-lite/usermanual-modelarts-lite-0098.html