AI开发平台MODELARTS-NPU Snt9B集合通信算子多机多卡性能测试指导:前提条件

时间:2024-04-30 19:22:38

前提条件

  • 确保主节点已经配置了其他节点机器的免密登录,配置方法参考NPU Snt9B裸金属服务器多机免密互通解决方案
  • 确保mpirun的安装路径都是相同的。
  • 确保设置的hostfile文件位于主节点中,且配置格式如下所示。
    # 训练节点ip:每节点的进程数
    192.168.1.1:8
    图1 示例
  • 确保所有节点的机器防火强都已关闭
    # 查看防火墙状态
    systemctl status firewalld
    # 关闭防火墙
    systemctl stop firewalld
support.huaweicloud.com/usermanual-modelarts-lite/usermanual-modelarts-lite-0220.html