弹性云服务器 ECS-异构类实例安装支持对应监控的CES Agent(Linux):前提条件

时间:2024-04-10 11:26:54

前提条件

  • 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?
  • 已配置委托,配置方法参考如何配置委托?
  • 实例已安装对应驱动。
    • GPU加速型实例:已安装GPU驱动。

      未安装GPU驱动的云服务器不支持采集GPU指标数据及上报事件。

      如果您的弹性云服务器未安装GPU驱动,可参见(推荐)GPU加速型实例自动安装GPU驱动(Linux)

    • AI加速型实例:已安装NPU驱动

      未安装NPU驱动的云服务器不支持采集NPU指标数据及上报事件。

      使用公共镜像创建的AI加速型实例默认已安装特定版本驱动,如果您使用私有镜像创建AI加速型实例,或者因其他原因需要安装驱动,请参考昇腾文档中心对应版本的《CANN软件安装指南》。

    • 安装驱动需使用默认路径。

      驱动安装完后,需重启实例,否则可能导致采集指标及上报事件失败。

    • 驱动正常安装后,最多10分钟将在控制台看到采集到的指标数据。
  • 已安装lspci工具,未安装lspci工具的云服务器影响GPU掉卡事件的上报。

    安装lspci工具的方法,请参见(可选)安装lspci工具

  • 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
support.huaweicloud.com/usermanual-ecs/ecs_03_2004.html