华为云用户手册

  • 高级配置 该功能为白名单特性,需要联系后台管理人员申请开通,审批同意后方可使用。 修改高级配置参数,可能导致任务无法正常执行,请谨慎修改。 只有当私有资源组空闲(运行中的执行器数为0)时,方可调整单执行器的CPU和内存规格。 登录性能测试服务控制台,在左侧导航栏中选择“测试资源”。 在资源组列表中,单击待操作的资源组中的“高级配置”,依照高级配置表设置参数。 表1 高级配置 参数 参数说明 单执行器CPU 1-128,整数,默认4,单位核(Cores)。 单执行器内存 1024-524288,整数,默认8192,单位MB。 容器与节点IP 选择容器IP与节点IP是否保存一致。 DNS策略 选择集群DNS或节点DNS。 单击“确定”。 单击“重置”可恢复默认值。
  • 新增集群 在创建私有资源组时,会选择一个节点集群。如果业务需要多个集群或者不同区域的集群共同运行压测任务,可以新增集群并配置压力占比将压测任务动态分配到不同集群上。 登录性能测试服务控制台,在左侧导航栏中选择“测试资源”。 在资源组列表中,单击待操作的资源组中的“资源调整”。 新增集群。 在“资源调整”对话框中,单击“新增集群”,参照表2设置基本信息,单击“确定”完成创建。 表2 新增集群 参数 参数说明 区域 在下拉框中选择已创建的CCE节点集群所在区域,可与当前CodeArts PerfTest所在区域不一致。 节点集群 在下拉框选择已创建的CCE节点集群。 执行节点 勾选执行压测的执行机,即在压测过程中能够提供自身性能数据的施压目标机器。 说明: 如新增集群所在区域与当前CodeArts PerfTest区域不一致,即使用跨区域节点,那么该节点要有访问公网权限,可以通过绑定弹性IP或者使用NAT转换等方式获得访问公网权限。 该步骤可重复执行,新增多个集群。 配置压力占比。 新增集群后,在“资源调整”对话框中可以查看到当前私有资源组所有的节点集群,可动态调整不同集群的压力占比数据。 (可选)删除节点集群。 在“资源调整”对话框中可以查看到当前私有资源组所有的节点集群,单击待删除节点集群后的“删除”,根据系统提示执行删除操作。
  • 扩缩容节点集群 登录性能测试服务控制台,在左侧导航栏中选择“测试资源”。 在资源组列表中,单击待操作的资源组中的“资源调整”。 扩缩容节点集群。 扩容资源组:在“资源调整”对话框中,单击待修改资源组后的“扩缩容”,在“选择执行节点”对话框中,勾选当前已存在的执行节点+需要扩容的执行节点,单击“选择”。 减容资源组:在“资源调整”对话框中,单击待修改资源组后的“扩缩容”,在“选择执行节点”对话框中,勾选需要保留的执行节点,单击“选择”。
  • 查看私有资源组信息 登录性能测试服务控制台,在左侧导航栏中选择“测试资源”。 在资源组列表中,可查看到如下表所示的私有资源组信息。 表3 私有资源组信息说明 信息名称 信息说明 私有资源组名称 创建私有资源组时输入的名称。 私有资源组状态 运行中 异常 需升级 部署中 执行器数 占用执行器数/执行器总数。 高性能测试工程的单执行器支持并发:HTTP/HTTPS(5000),WebSocket(5000),MQTT(5000),JMeter(1000),HLS/RTMP/HTTP-FLV(1000)。 可扩展测试工程的单执行器支持并发:500。 说明: 可扩展测试工程功能为白名单特性,需要联系后台管理人员申请开通,审批同意后方可使用。 当前并发 当前私有资源组内所有节点集群当前并发相加的和。 调试节点 创建私有资源组时选择的调试节点。 执行节点 资源组内所有节点集群的执行节点。单击“更多”,可以查看到该资源组全部执行节点。 创建时间 私有资源组创建的时间。 修改时间 私有资源组最后一次修改的时间。
  • 自定义JMeter安装包 如需切换JMeter的版本,可以自定义安装JMeter安装包来满足业务需求。 登录性能测试服务控制台,在左侧导航栏中选择“测试资源”。 按照业务需求,下载对应版本的JMeter安装包。 在资源组列表中,单击待操作的资源组中的“自定义JMeter安装包”,选择待安装的JMeter安装包导入文件,等待页面提示文件导入成功。 当前支持tgz、tar.gz、zip格式的文件,版本号在5.2.1及以上且小于100M的JMeter安装包,并确保该安装包本地可执行。 (可选)删除JMeter安装包。 如提示文件上传失败,或需要重新上传JMeter安装包。可单击安装包后的,删除当前JMeter安装包。
  • 报文如何填写 报文通俗的解释就是用户在网站界面上的所有单击操作。每个单击操作通过编辑成满足协议规范带有用户请求内容格式的码流传送给不同的第三方,最后得到一个正确或者失败响应的一个过程。 可以通过在操作时按“F12”,或抓包工具(例如wireshark)查看报文是怎么请求的,然后根据实际业务在压测的报文中填写。 例如,模拟登录请求的POST方法,对应的请求连接、请求方法、头域、报文内容如下图所示。 图1 模拟登录请求的POST方法
  • 操作步骤 登录性能测试服务控制台,在左侧导航栏中选择“PerfTest测试工程”。 在待编辑PerfTest测试工程所在行,单击工程名称进入测试工程详情页面。 选择“测试用例”页签,在左侧“用例列表”下选择待添加请求信息的用例。 在“用例步骤”页签中,选择待添加请求信息的用例,单击“添加请求”。 在“报文”页签,请根据业务的协议类型选择匹配的协议类型,当前支持HTTP/HTTPS/TCP/UDP/HLS/RTMP/WEBSOCKET/HTTP-FLV/MQTT。请参照以下对应的报文参数表设置基本信息。 表1 HTTP和HTTPS协议报文参数 参数 参数说明 请求方法 可以选择GET、POST、PATCH、PUT或DELETE。 请求地址 发送请求的URL地址,比如“http://域名/路径”,也可以包含参数的部分“http://域名/路径?key1=value1&key2=value2”。 支持变量输入,详情请参见插入变量。 响应超时(ms) 发送请求,等待服务器响应的超时时间。响应超时时间范围是20ms到5分钟。 如果不设置此参数,默认响应超时时间为5000ms。 携带cookie 说明: 用例下至少已有一个请求信息,添加新的请求信息时进行设置。 自动获取:使用响应设置的cookie。 手动设置:只使用当前请求信息设置在头域中的cookie。 自动重定向 选择是否跳转到重定向的地址,开关默认打开,即默认自动跳转到重定向的地址。 请求参数 请求地址中的参数设置。 单击“添加请求参数”,设置“名称”和“值”。选择是否勾选“Url Encode”,默认为不勾选,勾选后对请求参数的值做URL编码。 如果您不需要添加请求参数,可以单击“删除”,删除请求参数。 请求头 请根据压测服务器需要校验或者使用的头域来添加相关头域及内容。性能测试服务没有对必填头域作要求,仅透传用户定义的头域到压测服务器。“头域”的说明请参见头域说明。 单击“添加头域”,设置“头域”和“值”,如果您不需要添加头域信息,单击“删除”,删除报文头域。 单击“批量编辑”,可以切换成文本框编辑模式同时对多个头域进行编辑;单击“键值编辑”,可返回“键值对”编辑模式。 说明: “请求方法”为“POST”或“PUT”,且“头域”为“Content-Type”时,“值”有三种类型,且支持插入变量: 自定义:直接在输入框中输入值。 application/x-www-form-urlencoded:请求体为可添加的键值对形式,值为文本。 multipart/form-data:请求体为可添加的键值对形式,值可为文本或文件。值为文件时,支持body体导入。 Body体 实体的主体部分包含一个由任意数据组成的数据块,并不是所有的报文都包含实体的主体部分。 如果已设置全局变量或响应提取的局部变量,可在报文内容部分引用变量,执行压测任务过程会将报文内容中的变量值动态替换为指定的值。 在请求内容输入框内输入“$”。 在“插入变量”对话框中,配置参数。详情请参见插入变量。 单击“选择”。 表2 TCP协议报文参数 参数 参数说明 IP 发送请求到被测服务器的IP地址。 端口号 发送请求到被测服务器的端口号。 连接超时 发起连接,服务器无响应的超时时间。连接超时时间范围是20ms到60s。 返回超时 连接建立成功,等待响应返回的超时时间。返回超时时间范围是20ms到60s。 连接设置 重复使用连接:请求响应完成后,不断开连接,复用连接发送接收下一次请求响应。 关闭连接:每次完成请求响应完成后,断开连接,下一次重新建立连接。 返回结束设置 通过返回结束设置,来判断本次请求的响应内容是否已经接收完成。 返回数据长度:设置返回数据的长度,单位字节。当接收到此长度的响应内容时,数据接收完成。 结束符:设置返回数据的结束标记。当接收到结束符时,数据接收完成 。 说明: 结束符建议设置一个唯一的结束标记,如果设置的结束符在响应内容中存在多个,当接收到第一个结束符时,就认为响应内容已经接收完成,这样接收的响应数据就不完整。 内容格式 请根据被测服务器的业务请求内容,选择“字符串”或“16进制码流”。 说明: 16进制码流的内容取值范围为“0~9”和“a~f”,且总字符个数为双数。 如果已设置全局变量或响应提取的局部变量,可在报文内容部分引用变量,执行压测任务过程会将报文内容中的变量值动态替换为指定的值。 在请求内容输入框内输入“$”。 在“插入变量”对话框中,配置参数。详情请参见插入变量。 单击“选择”。 表3 UDP协议报文参数 参数 参数说明 IP 发送请求到被测服务器的IP地址。 端口号 发送请求到被测服务器的端口号。 返回结束设置 通过返回结束设置,来判断本次请求的响应内容是否已经接收完成。 返回数据长度:设置返回数据的长度,单位字节。当接收到此长度的响应内容时,数据接收完成。 结束符:设置返回数据的结束标记。当接收到结束符时,数据接收完成 。 说明: 结束符建议设置一个唯一的结束标记,如果设置的结束符在响应内容中存在多个,当接收到第一个结束符时,就认为响应内容已经接收完成,这样接收的响应数据就不完整。 内容格式 请根据被测服务器的业务请求内容,选择“字符串”或“16进制码流”。 说明: 16进制码流的内容取值范围为“0~9”和“a~f”,且总字符个数为双数。 如果已设置全局变量或响应提取的局部变量,可在报文内容部分引用变量,执行压测任务过程会将报文内容中的变量值动态替换为指定的值。 在请求内容输入框内输入“$”。 在“插入变量”对话框中,配置参数。详情请参见插入变量。 单击“选择”。 表4 HLS协议报文参数 参数 参数说明 流媒体地址 视频源的地址,比如“http://域名/路径”。 播放时长(秒) 模拟播放的时长。 说明: 用例调试时,播放时长会设置为3秒。 直播缓冲等待请求时间间隔(毫秒) 直播场景下,视频播放源无新数据时候,尝试获取新数据的时间间隔。 直播缓冲等待请求的最大次数 直播场景下,视频播放源无新数据时候,尝试获取新数据的最大次数,如果超过最大次数,则判断为失败。 表5 RTMP协议报文参数 参数 参数说明 请求方式 推流:将现场的视频信号传到网络的过程。 拉流:服务器里面有流媒体视频文件,用指定地址进行拉取的过程。 请求方式为“推流”时设置以下参数。 流媒体服务器地址 被测流媒体服务器的IP地址。 端口号 被测流媒体服务器监听的端口号,RTMP协议默认为1935。 应用名称 即推流URL中的AppName,直播流媒体文件存放路径,例如:live。 流名称 即推流URL中的StreamName,用来唯一标识一条直播流,例如:livestream。 推流时长(秒) 模拟主播推流的时长,单位:秒。 视频源地址 用来存放模拟直播推流的视频源文件的OBS地址。目前仅支持flv文件格式,且不支持H.265编码的非标准flv文件。 请求方式为“拉流”时设置以下参数。 流媒体服务器地址 被测流媒体服务器的IP地址。 端口号 被测流媒体服务器监听的端口号,RTMP协议默认为1935。 应用名称 即拉流URL中的AppName,直播流媒体文件存放路径,例如:live。 流名称 即拉流URL中的StreamName,用来唯一标识一条直播流,例如:livestream。 播放时长(秒) 模拟观众观看直播的时长,单位:秒。 表6 WEBSOCKET协议报文参数 参数 参数说明 请求方法 Connect:与压测网站建立WebSocket连接。 DisConnect:关闭与压测网站的连接。 Pong:向压测网站发送pong。 Ping&Pong:向压测网站发送pong期望返回ping。 Request:向压测网站发送请求并接收响应。 ReadOnly:仅接收压测网站发送的信息。 WriteOnly:仅向压测网站发送信息。 请求连接地址 WebSocket连接的URL地址,比如“ws://域名/路径”,支持加密请求,即“wss://域名/路径”。 连接超时(ms) 发起连接,服务器无响应的超时时间。连接超时时间范围是20ms到60s。 说明: 仅当“请求方法”为“Connect”时,需要设置该参数。 状态码 自定义关闭连接对应的状态码。默认值为1000,输入范围为0~4999。 说明: 仅当“请求方法”为“DisConnect”时,需要设置该参数。 请求类型 请根据被测服务器的业务请求内容,下拉选择“Text”或“Binary”。 说明: 仅当“请求方法”为“Request/WriteOnly”时,需要设置该参数。 请求内容 根据请求类型中设定格式输入请求信息报文内容。 说明: 仅当“请求方法”为“Request/WriteOnly”时,需要设置该参数。 响应类型 请根据被测服务器的业务响应内容,下拉选择“Text”或“Binary”。 说明: 仅当“请求方法”为“Request/ReadOnly”时,需要设置该参数。 响应超时(ms) 连接建立成功,等待响应返回的超时时间。返回超时时间范围是20ms到60s。 请求头 请根据压测服务器需要校验或者使用的头域来添加相关头域及内容。性能测试服务没有对必填头域作要求,仅透传用户定义的头域到压测服务器。“头域”的说明请参见头域说明。 单击“添加头域”,设置“头域”和“值”,如果您不需要添加头域信息,单击“删除”,删除报文头域。 单击“批量编辑”,可以切换成文本框编辑模式同时对多个头域进行编辑;单击“键值编辑”,可返回“键值对”编辑模式。 表7 HTTP-FLV协议报文参数 参数 参数说明 流媒体地址 视频源的地址,比如“http://{视频源ip}:8080/live/stream.flv”。 播放时长 模拟播放的时长。 说明: 用例调试时,播放时长会设置为3秒。 表8 MQTT协议报文参数 参数 参数说明 请求方法 Connect:与压测网站建立MQTT连接。 Publish:发布消息。 Subscribe:订阅发送的消息。 DisConnect:关闭与压测网站的MQTT连接。 请求方法为“Connect”时设置以下参数。 MQTT版本 MQTT的版本,当前支持3.1、3.1.1版本。 传输地址 MQTT服务器地址,地址支持TCP、SSL、WS、WSS协议。 超时时间(ms) 客户端建立连接、发送消息等相关操作的超时时间。 客户端ID MQTT客户端ID。通过“添加随机后缀”开关,可以设置客户端ID是否添加随机后缀。 用户名 MQTT客户端设置的用户名。用户名为敏感参数,请通过敏感参数模式的全局变量设值。 密码 MQTT客户端设置的密码。密码为敏感参数,请通过敏感参数模式的全局变量设值。 连接保活时长(s) 活动心跳间隔时间,单位为秒。 清空会话 打开开关,客户端和服务器之间建立连接时,会清空上一次连接所保留的会话信息。 关闭开关,客户端和服务器之间建立连接时,不会清空上一次连接所保留的会话信息。 添加遗嘱 打开开关,添加遗嘱。当客户端异常断开连接时,MQTT代理会自动将该遗嘱消息发布给其他订阅者。 添加遗嘱时设置以下参数: 主题:遗嘱的主题。 类型:支持Text和Binary类型,可以配置是否添加时间戳。 内容:遗嘱的内容。 QoS级别:服务质量等级,用于描述消息传递的可靠性。最多发送一次,适用于实时数据传输;至少发送一次,适用于需要可靠性但允许轻微延迟的应用;只发送一次,适用于需要高可靠性和较大延迟的应用。 保留遗嘱:打开开关,客户端订阅后马上就会收到设置的遗嘱信息;关闭开关,发布遗嘱信息的客户端发生意外断开之后,订阅了该客户端遗嘱信息的客户端才可收到遗嘱消息。 关闭开关,无遗嘱发送。 请求方法为“Publish”时设置以下参数。 主题 发布消息的主题。 QoS级别 服务质量等级,用于描述消息传递的可靠性。最多发送一次,适用于实时数据传输;至少发送一次,适用于需要可靠性但允许轻微延迟的应用;只发送一次,适用于需要高可靠性和较大延迟的应用。 请求类型 支持Text和Binary类型,可以配置是否添加时间戳。 请求内容 请求的详细内容。 超时时间(ms) 客户端发送消息的超时时间。 保留消息 打开开关,客户端断开连接时发布的消息仍会保留在服务器。 关闭开关,客户端断开连接时发布的消息会被清除。 请求方法为“Subscribe”时设置以下参数。 订阅主题 订阅消息的主题,应与发布消息的主题匹配。 QoS级别 服务质量等级,用于描述消息传递的可靠性。最多发送一次,适用于实时数据传输;至少发送一次,适用于需要可靠性但允许轻微延迟的应用;只发送一次,适用于需要高可靠性和较大延迟的应用。 响应类型 支持Text和Binary类型,可以配置是否添加时间戳。 超时时间(ms) 订阅主题的超时时间。 结束条件 达到该条件时,结束订阅消息。 触发耗时上限:达到设置的耗时上限时结束订阅消息。 触发收到消息数上限:达到设置的收到消息数上限时结束订阅消息。 请求方法为“Disconnect”时无需设置参数。 配置完成后,单击“保存”。
  • 修改导出的工程文件 表1 请求类型为思考时间 参数名称 描述 name 思考时间的名称,可修改。 t 持续时间(ms)。 思考时间是指用户在执行两个连续操作期间的等待时间。例如用户在登录和搜索之间停留的时间。 例如某事务每运行一次响应时间为 0.5 秒。 如果希望每秒执行两次事务请求:则不添加请求信息类型为“思考时间”的事务请求信息。 如果希望每秒只执行一次事务请求:思考时间调整为 1 秒。如果思考时间设置为 1 秒而响应时间大于 1 秒,则思考时间不会生效,按响应时间发送压测请求。 表2 请求类型为报文 参数名称 描述 name 报文的名称,可修改。 http_version 协议类型。 支持HTTP、HTTPS、TCP和UDP。 当请求类型为HTTP和HTTPS时,设置以下参数。 method 支持GET、POST、PATCH、PUT和DELETE。 return_timeout 发送请求,等待服务器响应的超时时间。 如果不设置此参数,默认响应超时时间为5000ms。 URL 发送请求的URL地址,比如“http://域名/路径”,也可以包含参数的部分“http://域名/路径?key1=value1&key2=value2”。 headers 由关键字/值对组成,请求头部通知服务器有关于客户端请求的信息,“头域”的说明请参见头域说明。 报文内容 实体的主体部分包含一个由任意数据组成的数据块,并不是所有的报文都包含实体的主体部分。 如果已设置全局变量或响应提取的局部变量,可在报文内容部分引用变量,执行压测任务过程会将报文内容中的变量值动态替换为指定的值。 当请求类型为TCP时,设置以下参数。 说明: TCP类型的报文暂不支持响应提取功能。 IP 发送请求到被测服务器的IP地址。 port 发送请求到被测服务器的端口号。 connect_timeout 发起连接,服务器无响应的超时时间。 return_timeout 连接建立成功,等待响应返回的超时时间。 连接设置 重复使用连接:请求响应完成后,不断开连接,复用连接发送接收下一次请求响应。 关闭连接:每次完成请求响应完成后,断开连接,下一次重新建立连接。 check_end_type 通过返回结束设置,来判断本次请求的响应内容是否已经接收完成。 返回数据长度:设置返回数据的长度,单位字节。当接收到此长度的响应内容时,数据接收完成。 结束符:设置返回数据的结束标记。当接收到结束符时,数据接收完成 。 说明: 结束符建议设置一个唯一的结束标记,如果设置的结束符在响应内容中存在多个,当接收到第一个结束符时,就认为响应内容已经接收完成,这样接收的响应数据就不完整。 body 实体的主体部分包含一个由任意数据组成的数据块,并不是所有的报文都包含实体的主体部分。 内容格式:请根据被测服务器的业务请求内容,选择“字符串”或“16进制码流”。 说明: 16进制码流的内容取值范围为“0~9”和“a~f”,且总字符个数为双数。 如果已设置全局变量或响应提取的局部变量,可在报文内容部分引用变量,执行压测任务过程会将报文内容中的变量值动态替换为指定的值。 表3 请求类型为响应提取 参数名称 描述 name 变量的名称,命名必须唯一,响应提取的值赋予此变量。 range 响应提取内容的范围。 报文内容 头域 URL 响应码 其中“报文内容”、“头域”、“URL”可通过正则表达式进行内容提取。 regexp 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 完整的正则表达式由两种字符构成:特殊字符(special characters)称为“元字符”(meta characters);其它为“文字”(literal),或者是普通文本字符(normal text characters,如字母、数字、汉字、下划线)。元字符的说明请参见正则表达式元字符。 说明: “()”表示提取,对于您要提取的内容需要用小括号括起来,每个“()”之间的内容表示一个子表达式。 match_index 在正则表达式已提取的内容中,获取第几个匹配的内容。 取值范围:正整数。 说明: 该参数值不可设置为0。 exp_index 表示解析到的第几个子表达式的值。 取值范围:自然数。 说明: 取值为0表示匹配整个正则表达式。 取值为1表示匹配正则表达式的第一个子表达式即第一个“()”提取的内容。 通过“正则表达式”和“第几个匹配项”提取出内容后,再通过“表达式取值”获得最终的提取内容。 JSON Key Name 请输入需要获取的键名。 例:{key:{"key1":"v1","key2":["v2","v3"]}},如果想取出“v2”,则输入key.key2[0] default 正则匹配失败时,取的值。 表4 请求类型为检查点 参数名称 描述 name 检查点的名称,可修改。 value 响应报文携带的HTTP/HTTPS/TCP/UDP协议响应状态码,通常包括1XX,2XX,3XX,4XX,5XX。 header_checks HTTP/HTTPS/TCP/UDP协议的Header部分。 body_checks HTTP/HTTPS/TCP/UDP/MQTT协议的Body部分,为HTTP/HTTPS/TCP/UDP/MQTT协议请求、响应的负载部分。 表5 新增测试工程 参数名称 描述 name 测试工程的名称。 description 测试工程的相关描述。 表6 新增事务 参数名称 描述 name 事务名称。 contents 请求信息内容。 在该事务下可以添加事务请求信息,您可以根据业务需求添加多个事务请求信息。 表7 新增任务 参数名称 描述 issue_num 并发用户。 并发用户数指在同一时刻内,对系统进行业务操作的用户数量,在性能测试服务中为用户在定义测试任务阶段设置的虚拟用户数。 name 阶段名称。 设置一个符合业务场景的名字,比如首页测试。 time 持续时间(s)。 本阶段压测执行的最长时间。 count 发送总次数。 该事务在一次任务的运行中,将按照运行次数计算,到达设定数值,该任务下此事务的性能测试将终止。 表8 新增全局变量 参数名称 描述 name 全局变量的名称。 variable 全局变量值。 variable_type 说明: 变量的内容,在压测时将以明文传输,请谨慎输入,注意数据安全。 全局变量类型。 变量类型为整数时,输入变量值范围。 压测任务运行时会读取对应全局变量范围内的值,针对每个虚拟用户,依次轮询变量值,即第一个虚拟用户取变量的第一个值,第二个虚拟用户取第二个值,依顺序取值,不够则循环。 您可以根据业务需求添加多个变量值。 压测任务运行时会读取对应全局变量的参数值,针对每个虚拟用户,依次轮询变量值,即第一个虚拟用户取变量的第一个值,第二个虚拟用户取第二个值,依顺序取值,不够则循环。 父主题: 参考知识
  • 操作步骤 登录性能测试服务控制台,在左侧导航栏中选择“PerfTest测试工程”。 在待编辑PerfTest测试工程所在行,单击工程名称进入测试工程详情页面。 选择“测试用例”页签,在左侧“用例列表”下选择待添加请求信息的用例。 在“用例步骤”页签中,选择待添加请求信息的用例,单击“添加请求”。 在“检查点”页签,参照表1设置基本信息。 表1 检查点参数 参数 参数说明 启用结果检查 启用检查点后,通过自定义校验信息来验证服务端的返回内容是否正确。 重试次数 请求失败后,进行重试的次数,直到该请求成功,取值范围为0~100。 说明: 重试的请求在报告中不统计,例如响应时间、RPS、成功率等,报告中仅统计最后一次的数据。 重试间隔 请求失败后,下一次重试请求执行的时间间隔,单位毫秒(ms),取值范围为0~3600000,即最大时间间隔为1小时。 响应码 仅在“报文”页签中“协议类型”为“HTTP”或者“HTTPS”时,需要设置。 响应报文携带的HTTP/HTTPS协议响应状态码,通常包括1XX,2XX,3XX,4XX和5XX。 头域 仅在“报文”页签中“协议类型”为“HTTP”或者“HTTPS”时,需要设置。 HTTP/HTTPS协议的Header部分。 单击“添加头域检查”。 设置“头域名”,详情请参见头域说明。 设置检查条件。 设置内容。 响应内容 HTTP/HTTPS/TCP/UDP/WEBSOCKET/MQTT协议的Body部分,为HTTP/HTTPS/TCP/UDP/WEBSOCKET/MQTT协议请求、响应的负载部分。 单击“添加内容检查”。 设置检查条件。 条件规则 AND:需要全部符合才能检查通过。 OR:只需一条符合即可检查通过。 配置完成后,单击“保存”。
  • 操作步骤 登录性能测试服务控制台,在左侧导航栏中选择“PerfTest测试工程”。 在待编辑PerfTest测试工程所在行,单击编辑事务库。 在“事务库”页签中,单击“创建事务”,配置以下参数。 事务名称:自定义事务名称。 事务类型:常规事务,表示常规场景下的性能测试事务,支持HTTP/HTTPS/TCP/UDP/HLS/RTMP/WEBSOCKET/HTTP-FLV/MQTT协议的接口测试,支持多个事务请求信息串联。 一个常规事务下最多可添加40个请求信息。 单击“确定”。 为事务添加请求信息,添加完成后,单击“确定”。 常规事务可以同时添加报文、思考时间、响应提取、检查点四个请求组成。其中,报文为必选项。 请求组成为“报文”:报文是HTTP应用程序之间发送的数据块。详细步骤请参见添加请求信息(报文)。 请求组成为“思考时间”:设置执行下一个动作之间停留的持续时间。详细步骤请参见添加请求信息(思考时间)。 请求组成为“响应提取”:如果同一事务中存在多个报文,通过正则表达式或JSON提取把前一个报文的输出提取出来,做后一个报文的输入。详细步骤请参见添加请求信息(响应提取)。 请求组成为“检查点”:通过自定义校验信息来验证服务端的返回内容是否正确。详细步骤请参见添加请求信息(检查点)。 (可选)一个事务包含1个或多个请求信息。如果您的事务包含多个请求信息,单击“添加请求”,再执行添加请求的相关操作。
  • 产品功能 性能测试服务提供了HTTP/HTTPS/TCP/UDP/HLS/RTMP/WEBSOCKET/HTTP-FLV/MQTT协议的高并发测试能力,可以支持多协议报文内容、事务、测试任务模型的灵活自定义,可实时、离线查看并发、RPS、响应时延等多个维度的性能统计,同时根据用户对性能测试规模的变化,提供按需的私有测试集群创建、扩缩容等性能测试集群管理能力。 多协议高并发性能测试 标准HTTP/HTTPS/TCP/UDP/HLS/RTMP/WEBSOCKET/HTTP-FLV/MQTT报文内容快捷自定义,简单调整即可给不同的被测试应用发送压测流量。 可以根据被测试应用的实际需求,对HTTP/HTTPS/TCP/UDP/HLS/RTMP/WEBSOCKET/HTTP-FLV/MQTT协议报文的任何字段内容进行自定义,包括HTTP GET/POST/PATCH/PUT/DELETE方法、URL、Header、Body等字段的设置和编辑。 虚拟用户的行为定义,适配不同测试场景。 通过思考时间对同一个用户的请求设置发送间隔或者在一个事务中定义多个请求报文来设置每个用户每秒内发起的请求数。 自定义针对响应结果的校验,使请求成功的检查点更准确。 针对每个用户的请求,支持用户配置检查点,在获取到响应报文后针对响应码、头域及响应body内容做结果检验,只有条件匹配后才认为是正常响应。 测试任务模型自定义,支持复杂场景测试 通过多种用例步骤和压力模型的灵活组合,可以帮助用户测试在多操作场景并发下的应用性能表现。 测试用例可以被多个测试任务复用,针对每个测试用例可以选择不同的压力模型,并定义持续时间、并发用户数、震荡或浪涌次数等参数,模拟流量波峰波谷的复杂场景。 图2 支持复杂场景测试
  • 性能测试灵活快捷,助力应用快速上线 协议灵活自定义:支持HTTP/HTTPS测试,适应基于HTTP/HTTPS协议开发的各类应用和微服务接口性能测试;支持TCP/UDP/WEBSOCKET测试,支持字符串负载与16进制码流两种模式,满足各类非HTTP类协议的数据构造;支持HLS/RTMP/HTTP-FLV/MQTT测试。 多事务元素与测试任务阶段的灵活组合:提供灵活的数据报文、事务定义能力,结合多事务组合,测试任务波峰波谷,可模拟多用户多个操作的组合场景,轻松应对复杂场景的测试;支持针对每个事务指定时间段定义并发用户数,模拟突发业务流量。
  • 基本概念 测试工程:测试工程分为“PerfTest测试工程”和“JMeter测试工程”。PerfTest测试工程指性能测试服务为用户的测试工程提供管理能力,事务、压测任务、测试报告的内容在同一个测试工程内共享复用,您可以为不同的测试项目创建不同的测试工程。JMeter测试工程指用户在性能测试服务中导入JMeter脚本的测试工程。 事务:事务是指用户自定义的操作模型,包括HTTP/HTTPS/TCP/UDP/WEBSOCKET报文、思考时间、响应提取和检查点,以及HLS/RTMP/HTTP-FLV/MQTT报文部分。 报文:报文是HTTP等应用程序之间发送的数据块。这些数据块以一些文本形式的元信息开头,这些信息描述了报文的内容及含义,后面跟着可选的数据部分。这些报文都是在客户端、服务器和代理之间流动。 思考时间:为了更好的模拟用户的行为,需要模拟用户在不同操作之间等待的时间,例如,当用户收到来自服务器的数据时,可能要等待几秒查看数据,然后再做出响应,这种延迟,就称为思考时间 响应提取:如果同一事务中存在多个报文,通过正则表达式或JSON提取把前一个报文的输出提取出来,作后一个报文的输入。 检查点:检查点主要是通过自定义校验信息来验证服务端的返回内容是否正确。 并发用户数:并发用户数指在同一时刻内,对系统进行业务操作的用户数量,在性能测试服务中指用户在定义测试任务阶段设置的虚拟用户数。 响应时间:响应时间指从客户端发一个请求开始计时,到客户端接收到从服务器端返回的响应结果结束所经历的时间。
  • 创建私有资源组 首次创建测试资源,需父账号授权,自动创建委托使性能测试服务可以操作用户CCE。 需要使用性能测试服务的用户,需要CodeArts PerfTest Administrator或CodeArts PerfTest Developer权限(仅能查看自己创建的工程)。 需要管理私有资源组的用户,需要CodeArts PerfTest Administrator或CodeArts PerfTest Developer+CodeArts PerfTest Resource Administrator权限。 需要使用私有资源组的用户,需要CodeArts PerfTest Administrator或CodeArts PerfTest Developer+CodeArts PerfTest Resource Developer权限。 使用性能测试服务依赖的权限及具体使用场景,详见使用性能测试服务需要哪些权限。 登录性能测试服务控制台,在左侧导航栏中选择“测试资源”,单击“创建私有资源组”。 (可选)首次使用时,请根据提示信息,授权性能测试服务创建私有资源组。 进入创建资源组页面后,如果是首次使用没有云容器引擎服务CCE集群,需要先执行4创建集群然后再创建资源组。如果已有可用的云容器引擎服务CCE集群,直接执行5创建资源组。 创建集群。 单击页面上方的“创建集群”,进入购买CCE集群页面。创建集群操作请参考购买CCE集群,设置集群参数。 集群管理规模选择与执行节点个数相关,请根据需要压测的并发用户数,创建对应规格的节点。例如,需要20个执行节点,那么创建集群时集群规模选择50节点即可满足业务需求。 CCE集群的网络模型建议选择“容器隧道网络”,容器网段和服务网段需要与被测对象保持一致。 单击“下一步:插件配置”,默认选择即可。 单击“下一步:规格确认”,确认集群配置信息无误后,勾选已阅读使用说明,单击“提交”等待集群创建,集群创建预计需要6-10分钟。 集群创建成功后,返回集群管理页面,单击“创建节点”,进入创建节点页面。创建节点操作请参考创建节点,设置节点参数。 节点规格至少为vCPU为4核,内存8GB。 操作系统需选择欧拉EulerOS。 创建的节点数量至少需要2台(1台调试节点、1台执行节点),具体数量由压测对象要求规格决定。例如,压测10万并发用户数,vCPU为4核,内存8GB的资源需要21个执行节点(1个调试节点,20个执行节点)。 当CCE集群节点与被测应用不在同一VPC网络时,建议CCE集群节点绑定弹性IP。可使用已有的弹性IP,如果没有弹性IP也可以选择自动创建。自动创建弹性IP时,计费方式推荐按流量计费,带宽设置尽可能选择较大值,否则可能影响压测效果。系统根据您的配置创建弹性IP,并自动为每个节点进行分配。当创建的弹性IP数量小于节点个数时,会将弹性IP随机绑定到节点上。 单击“下一步:规格确认”,确认节点配置信息无误后,勾选已阅读使用说明,单击“提交”等待节点创建。节点创建成功后,返回性能测试服务控制台。 创建资源组。 在左侧导航栏中选择“测试资源”,单击“创建私有资源组”。 参照表1设置基本信息。 表1 创建私有资源组 参数 参数说明 资源组名称 新建私有资源组的名称,例如:Web-test-demo。 节点集群 在下拉框选择已创建的CCE集群。 调试节点 执行压测的调试机。 调试节点在资源组创建成功后不可修改。 执行节点 执行压测的执行机,即在压测过程中能够提供自身性能数据的施压目标机器。 单击“创建”。
  • 一键告警 弹性云服务器运行在物理机上,虽然提供了多种机制来保证系统的可靠性、容错能力和高可用性,但是,服务器的硬件、电源等部件仍有较小概率的损坏。云平台默认提供了自动恢复功能,当弹性云服务器所在的硬件出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,保障您受到的影响最小,该过程会导致云服务器重启。了解更多 您可以在 云监控服务 控制台为弹性云服务器开启“一键告警”功能,以便在HA发生(弹性云服务器所在的物理机出现故障,系统自动迁移弹性云服务器至正常的物理机)时,及时获得通知。配置方法请参见一键告警。
  • 获取安装脚本 您可以通过执行以下命令,获取支持GPU监控和NPU监控的 CES Agent的安装脚本。 表3 安装脚本的支持区域及获取方式 区域 安装脚本 华北-北京一 单台E CS 安装: cd /usr/local && curl -k -O https://uniagent-cn-north-1.obs.cn-north-1.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-north-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-cn-north-1.obs.cn-north-1.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-north-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 华北-北京四 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-north-4 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-north-4 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 华北-乌兰察布一 单台ECS安装: cd /usr/local && curl -k -O https://obs.cn-north-9.myhuaweicloud.com/uniagent-cn-north-9/package/agent_install.sh && bash agent_install.sh -r cn-north-9 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://obs.cn-north-9.myhuaweicloud.com/uniagent-cn-north-9/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-north-9 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 华南-广州 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-cn-south-1.obs.cn-south-1.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-south-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-cn-south-1.obs.cn-south-1.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-south-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 华东-上海一 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-cn-east-3.obs.cn-east-3.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-east-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-cn-east-3.obs.cn-east-3.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-east-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 华东-上海二 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-cn-east-2.obs.cn-east-2.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-east-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-cn-east-2.obs.cn-east-2.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-east-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 西南-贵阳一 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-cn-southwest-2.obs.cn-southwest-2.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-southwest-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-cn-southwest-2.obs.cn-southwest-2.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-southwest-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 中国-香港 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-ap-southeast-1.obs.ap-southeast-1.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r ap-southeast-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-ap-southeast-1.obs.ap-southeast-1.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r ap-southeast-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 亚太-曼谷 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-ap-southeast-2.obs.ap-southeast-2.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r ap-southeast-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-ap-southeast-2.obs.ap-southeast-2.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r ap-southeast-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 亚太-新加坡 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-ap-southeast-3.obs.ap-southeast-3.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r ap-southeast-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-ap-southeast-3.obs.ap-southeast-3.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r ap-southeast-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 亚太-雅加达 单台ECS安装: cd /usr/local && curl -k -O https://obs.ap-southeast-4.myhuaweicloud.com/uniagent-ap-southeast-4/package/agent_install.sh && bash agent_install.sh -r ap-southeast-4 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://obs.ap-southeast-4.myhuaweicloud.com/uniagent-ap-southeast-4/package/batch_agent_install.sh && bash batch_agent_install.sh -r ap-southeast-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 非洲-约翰内斯堡 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-af-south-1.obs.af-south-1.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r af-south-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-af-south-1.obs.af-south-1.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r af-south-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 拉美-墨西哥城二 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-la-north-2.obs.la-north-2.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r la-north-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-la-north-2.obs.la-north-2.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r ap-southeast-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 拉美-圣地亚哥 单台ECS安装: cd /usr/local && curl -k -O https://obs.la-south-2.myhuaweicloud.com/uniagent-la-south-2/package/agent_install.sh && bash agent_install.sh -r la-south-2 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://obs.la-south-2.myhuaweicloud.com/uniagent-la-south-2/package/batch_agent_install.sh && bash batch_agent_install.sh -r ap-southeast-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 中东-利雅得 单台ECS安装: cd /usr/local && curl -k -O https://uniagent-me-east-1.obs.me-east-1.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r me-east-1 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 多台ECS批量安装: cd /usr/local && curl -k -O https://uniagent-me-east-1.obs.me-east-1.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r ap-southeast-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com
  • (可选)安装lspci工具 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors.myhuaweicloud.com/repo/mirrors_source.sh && bash mirrors_source.sh 更多内容,请参见如何使用自动化工具配置华为云镜像源(x86_64和ARM)? 执行以下命令,安装lspci工具。 CentOS系统: yum install pciutils Ubuntu系统: apt install pciutils 执行以下命令,查看安装结果。 lspci -d 10de: 图3 安装结果
  • 操作步骤(单台ECS安装) 本操作以Ubuntu 18.04 64bit操作系统、Pi2规格的GPU加速型实例为例,介绍单台ECS安装支持GPU监控的CES Agent的操作指导。 使用root用户,远程登录弹性云服务器。 执行以下命令,为单台ECS安装支持GPU监控的CES Agent。 以“华北-北京四”为例,其余区域的安装脚本,请参见获取安装脚本。 cd /usr/local && curl -k -O https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-north-4 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 其中,“cn-north-4”表示区域ID,“0.1.5”是uniagent版本号,“2.6.7.1”是telescope版本号。 当显示如下内容,表示支持GPU监控的CES Agent安装成功。 图1 支持GPU监控的CES Agent安装成功
  • 操作场景 通过在异构类(例如,GPU加速型实例、AI加速型实例)的Linux实例上安装支持对应监控的CES Agent,可以为用户提供系统级、主动式、细颗粒度的监控,包含相关异构指标收集和系统事件上报。 当前支持的异构加速卡及对应的监控指标种类如下: GPU监控指标,请参见操作系统监控指标:GPU。 NPU监控指标,请参见操作系统监控指标:NPU。 本章节介绍如何通过安装脚本为异构(GPU加速型、AI加速型)实例安装支持对应监控的CES Agent: 操作步骤(单台ECS安装) 操作步骤(多台ECS批量安装)
  • 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 实例已安装对应驱动。 GPU加速型实例:已安装GPU驱动。 未安装GPU驱动的云服务器不支持采集GPU指标数据及上报事件。 如果您的弹性云服务器未安装GPU驱动,可参见(推荐)GPU加速型实例自动安装GPU驱动(Linux)。 AI加速型实例:已安装NPU驱动 未安装NPU驱动的云服务器不支持采集NPU指标数据及上报事件。 使用公共镜像创建的AI加速型实例默认已安装特定版本驱动,如果您使用私有镜像创建AI加速型实例,或者因其他原因需要安装驱动,请参考昇腾文档中心对应版本的《CANN软件安装指南》。 安装驱动需使用默认路径。 驱动安装完后,需重启实例,否则可能导致采集指标及上报事件失败。 驱动正常安装后,最多10分钟将在控制台看到采集到的指标数据。 已安装lspci工具,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 安装lspci工具的方法,请参见(可选)安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
  • 操作步骤(多台ECS批量安装) 本操作以Ubuntu 18.04 64bit操作系统、Pi2规格的GPU加速型实例为例,介绍多台ECS批量安装支持GPU监控的CES Agent的操作指导。 批量安装的多台ECS需要归属于同一个VPC。 使用root用户,远程登录其中一台弹性云服务器。 执行以下命令,为这一台ECS安装支持GPU监控的CES Agent。 以“华北-北京四”为例,其余区域的安装脚本,请参见获取安装脚本。 cd /usr/local && curl -k -O https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/agent_install.sh && bash agent_install.sh -r cn-north-4 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 其中,“cn-north-4”表示区域ID,“0.1.5”是uniagent版本号,“2.6.7.1”是telescope版本号。 当支持GPU监控的CES Agent安装成功,且数据采集正常时,可以将此ECS作为跳板机,通过批量安装脚本依次为其他ECS批量安装支持GPU监控的CES Agent。 收集需要批量安装支持GPU监控的CES Agent的所有ECS的IP地址和root用户密码,以iplist.txt格式整理,并上传到ECS跳板机的/usr/local目录下。 iplist.txt格式为“IP地址,root用户密码”,每个记录一行。 示例如下所示(示例中abcd为root用户密码,请按实际值填写): 192.168.1.1,abcd 192.168.1.2,abcd 执行以下命令,为多台ECS批量安装支持GPU监控的CES Agent。 以“华北-北京四”为例,其余区域的批量安装脚本,请参见获取安装脚本。 cd /usr/local && curl -k -O https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/batch_agent_install.sh && bash batch_agent_install.sh -r cn-north-4 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 其中,cn-north-4是RegoinID,0.1.5是uniagent版本号,2.6.7.1是telescope版本号。 当显示如下内容,表示支持GPU监控的CES Agent安装成功。 图2 支持GPU监控的CES Agent安装成功
  • 约束与限制 仅支持Linux操作系统。 对于GPU监控: 支持GPU监控的Linux公共镜像如表1所示。 表1 支持GPU监控的Linux版本 类型 版本 CentOS(64bit) 7.6、7.9、8.2 Ubuntu(64bit) 16.04、18.04、20.04 支持GPU监控的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1。 对于NPU监控: 支持NPU监控的Linux公共镜像如所示。 表2 支持NPU监控的Linux版本 类型 版本 CentOS(64bit) 7.6:Ai1s、Ai2、Kai1s、Kai2 7.7-7.9:Ai2、Kai2 Ubuntu(64bit) 18.04 支持NPU监控的规格:Ai1s, Ai2, Kai1s, Kai2
  • 修订记录 发布日期 修订记录 2024-01-25 第一百零四次正式发布。 修改 默认安全组和规则,修改默认安全组规则。 备份弹性云服务器,增加后续操作。 2024-01-05 第一百零三次正式发布。 新增实例重部署预处理。 2023-10-19 第一百零二次正式发布。 新增 授权维护 本地盘换盘预处理(裸金属类型实例) 修改 事件概述,新增“授权维护”事件的说明。 2023-10-13 第一百零一次正式发布。 新增通过规格选型引导 购买云服务器 。 2023-09-20 第一百次正式发布。 新增 授权重部署 立即重部署 修改 事件概述,修改本地盘换盘事件的修复建议,新增实例重部署事件。 授权换盘,修改操作步骤。 2023-09-08 第九十九次正式发布。 修改操作步骤,涉及: 查看弹性云服务器详细信息(列表视图) 查看云服务器详细信息(精简视图) 导出弹性云服务器列表信息 搜索云服务器 2023-08-25 第九十八次正式发布。 修改 更改安全组,增加批量更改安全组的操作。 搜索云服务器,更新操作步骤。 新增 加入安全组 移出安全组 2023-08-03 第九十七次正式发布。 新增异构类实例安装支持对应监控的CES Agent(Windows)。 2023-07-31 第九十六次正式发布。 新增事件管理。 2023-06-30 第九十五次正式发布。 新增变更规格(批量操作)。 2023-06-15 第九十四次正式发布。 修改 更新一键式重置密码插件安装步骤,涉及: 安装一键式重置密码插件(单台操作) 更新一键式重置密码插件(单台操作) 更新一键式重置密码插件( AOM 方式) 更新一键式重置密码插件(批量操作-Windows系统) 下线“更新一键式重置密码插件(批量操作-Linux系统非root用户)” 2023-05-31 第九十三次正式发布。 修改 支持 云审计 的关键操作,补充支持审计的关键操作列表。 按需计费,补充保证金相关说明。 弹性云服务器支持的操作系统监控指标(安装Agent)、弹性云服务器支持的进程监控指标(安装Agent),补充维度相关信息。 2023-05-27 第九十二次正式发布。 修改 按需计费、竞价计费模式概述,修改关机计费策略。 2023-03-14 第九十一次正式发布。 新增 异构类实例安装支持对应监控的CES Agent(Linux) 2023-02-24 第九十次正式发布。 新增 弹性云服务器支持的进程监控指标(安装Agent) 2023-01-13 第八十九次正式发布。 修改按需转包年/包月,增加按需转包年/包月时,关联资源计费模式转换规则。 2022-12-26 第八十八次正式发布。 修改远程登录Linux弹性云服务器(CloudShell方式),更新前提条件。 2022-12-20 第八十七次正式发布。 新增 启、停弹性云服务器 2022-12-12 第八十六次正式发布。 新增 GPU加速型实例卸载GPU驱动 2022-11-25 第八十五次正式发布。 Tesla驱动及CUDA工具包获取方式,修改CUDA工具包下载地址。 2022-11-15 第八十四次正式发布。 新增开启/关闭超线程。 变更规格通用操作,增加“开启/关闭超线程”操作步骤。 2022-10-27 第八十三次正式发布。 新增 QingTian Enclave管理 2022-08-31 第八十二次正式发布。 新增 更新一键式重置密码插件(AOM方式) 2022-08-29 第八十一次正式发布。 新增 (推荐)GPU加速型实例自动安装GPU驱动(Windows) 获取一键式重置密码插件 2022-08-15 第八十次正式发布。 新增变更规格(性能助手版)。 2022-08-04 第七十九次正式发布。 KVM实例变更为QingTian实例(Windows),新增“检查SCSI驱动”步骤。 2022-07-26 第七十八次正式发布。 新增(推荐)GPU加速型实例自动安装GPU驱动(Linux)。 修改GPU加速型实例安装GRID驱动、Tesla驱动及CUDA工具包获取方式,更新驱动版本。 2022-06-10 第七十七次正式发布。 修改切换操作系统,更新“约束与限制”和“计费规则”。 2022-05-16 第七十六次正式发布。 “启动模板”和“智能购买组”商用,修改: 概述 概述 2022-04-20 第七十五次正式发布。 优化“密码和密钥对”章节: 新增 密码使用场景介绍 密钥对使用场景介绍 通过puttygen.exe工具创建密钥对 导入密钥对 修改 (推荐)通过管理控制台创建密钥对 2022-03-28 第七十四次正式发布。 修改安装一键式重置密码插件(单台操作),补充优化selinux相关的前提条件。 2022-03-07 第七十三次正式发布。 新增搜索云服务器。 修改管理云服务器组,补充故障域相关内容。 2022-01-07 第七十二次正式发布。 新增更新一键式重置密码插件(单台操作)。 2021-11-15 第七十一次正式发布。 修改KVM实例变更为QingTian实例(Windows),修改支持的规格类型。 修改KVM实例变更为QingTian实例(Linux),修改支持的规格类型及操作步骤。 2021-11-02 第七十次正式发布。 修改切换操作系统的约束与限制内容。 2021-09-30 第六十九次正式发布。 新增远程登录Linux弹性云服务器(通过macOS系统主机)。 2021-09-17 第六十八次正式发布。 无公网IP的弹性云服务器访问Internet,修改Linux操作系统的代理主机的操作步骤。 2021-08-23 第六十七次正式发布。 新增提升云服务器安全性方法概述 修改云备份概述,补充备份、快照、镜像有什么区别。 2021-07-28 第六十六次正式发布。 安装一键式重置密码插件(单台操作),修改Linux操作系统卸载插件的操作步骤。 2021-06-30 第六十五次正式发布。 安装一键式重置密码插件(单台操作),补充修改重置密码插件的文件权限的操作步骤。 2021-06-24 第六十四次正式发布。 新增 远程登录Linux弹性云服务器(通过华为云APP) 2021-05-29 第六十三次正式发布。 新增 KVM实例变更为QingTian实例(Windows) KVM实例变更为QingTian实例(Linux) 2021-05-25 第六十二次正式发布。 新增 动态获取IPv6地址,补充Windows 2012操作系统的操作步骤。 2021-05-12 第六十一次正式发布。 新增 启动模板 智能购买组 2021-04-25 第六十次正式发布。 新增 竞价计费模式概述 竞享计费型实例 购买竞享计费型实例 2021-03-03 第五十九次正式发布。 修改 动态获取IPv6地址,补充支持IPv6的区域和规格。 2021-02-20 第五十八次正式发布。 修改 包年/包月转按需的操作步骤。 2021-02-08 第五十七次正式发布。 修改 更换弹性公网IP补充约束限制。 2020-11-18 第五十六次正式发布。 新增XEN实例变更为KVM实例(Linux-批量自动配置) 2020-09-14 第五十五次正式发布。 修改 弹性云服务器支持的基础监控指标,修改带内网络流入速率、带内网络流出速率、带外网络流入速率、带外网络流出速率。 新增远程登录Linux弹性云服务器(CloudShell方式)。 2020-07-25 第五十四次正式发布。 新增 元数据获取,新增注意事项、防火墙配置示例的操作步骤。 实例自定义数据注入,删除使用明文密码的示例。 2020-05-26 第五十三次正式发布。 新增 主机安全 2020-04-23 第五十二次正式发布。 新增 新增磁盘 解绑弹性公网IP 修改 绑定弹性公网IP 2020-03-18 第五十一次正式发布。 新增远程登录Windows弹性云服务器(RDP文件方式)。 GPU加速型实例安装Tesla驱动及CUDA工具包,优化安装Tesla驱动及CUDA工具包操作指导。 新增GPU驱动概述,介绍GRID驱动和Tesla驱动。 重装操作系统、切换操作系统,修改操作步骤。 2020-01-20 第五十次正式发布。 修改ECS自定义策略, IAM 控制台改版,修改权限相关描述及操作。 ECS自定义策略,修改ECS系统权限策略名称。 2020-01-03 第四十九次正式发布。 新增远程登录Windows弹性云服务器(通过macOS系统主机)。 修改创建用户并授权使用ECS。 弹性云服务器支持的基础监控指标,新增监控指标“network_vm_connections”。 2019-12-16 第四十八次正式发布。 新增网卡概述。 新增弹性公网IP概述。 XEN实例变更为KVM实例(Windows),修改安装驱动的操作步骤。 2019-12-03 第四十七次正式发布。 修改 修改ECS自定义策略,新增可视化视图配置自定义策略。 上线“切换虚拟私有云”。 2019-11-01 第四十六次正式发布。 下线“切换虚拟私有云”。 管理云服务器组补充约束与限制。 在控制台重置弹性云服务器密码支持开机重置云服务器密码。 移动“在操作系统内部修改云服务器密码”至常见问题。 移动“未安装重置密码插件且忘记密码时,如何重置密码(Windows)?”至常见问题。 移动“未安装重置密码插件且忘记密码时,如何重置密码(Linux)?”至常见问题。 新增管理项目和企业项目。 更改时区修改设置时区的举例。 2019-10-28 第四十五次正式发布。 修改 XEN实例变更为KVM实例(Windows) XEN实例变更为KVM实例(Linux-自动配置) XEN实例变更为KVM实例(Linux-手动配置) 修改开启网卡多队列功能,Linux云服务器网卡多队列支持列表。 新增“切换虚拟私有云”。 2019-10-17 第四十四次正式发布。 修改 弹性云服务器支持的基础监控指标 查看创建状态 新增 弹性云服务器支持的操作系统监控指标(安装Agent) 2019-09-23 第四十三次正式发布。 修改 开启网卡多队列功能,补充说明Linux操作系统云服务器建议将操作系统内核版本升级至2.6.35及以上。 GPU加速型实例安装Tesla驱动及CUDA工具包,修改安装NVIDIA驱动和CUDA驱动的操作步骤。 修改弹性公网IP的带宽,修改操作场景。 管理云服务器组,补充添加云服务器到云服务器组的注意事项。 2019-09-12 第四十二次正式发布。 新增 更换弹性公网IP,修改操作场景。 2019-09-06 第四十一次正式发布。 修改 配置安全组规则。 在控制台重置弹性云服务器密码。 2019-08-28 第四十次正式发布。 新增 远程登录Windows弹性云服务器(通过移动设备)。 远程登录Linux弹性云服务器(通过移动设备)。 修改 管理云服务器组,添加云服务器到云服务器组补充注意事项。 2019-08-01 第三十九次正式发布。 修改 查看创建状态 查看失败任务 资源与标签 动态获取IPv6地址,修改CentOS 6.3添加ip6tables规则的命令。 2019-07-27 第三十八次正式发布。 新增 查看云服务器详细信息(精简视图) 远程登录Windows弹性云服务器(MSTSC方式)新增“本地Linux操作系统登录Windows云服务器”。 XEN实例变更为KVM实例(Windows) XEN实例变更为KVM实例(Linux-自动配置) 2019-06-30 第三十七次正式发布。 新增 包年/包月计费 按需计费 包年/包月转按需 修改 全文手册结构调整。 下线“查看云服务器详细信息(精简视图)”。 修改重置密码的字符集。 2019-05-30 第三十六次正式发布。 新增 权限管理 修改弹性公网IP的带宽 修改 实例自定义数据注入,新增实例自定义数据注入示例。 删除“故障处理”章节。 远程登录Windows弹性云服务器(MSTSC方式) 2019-04-30 第三十五次正式发布。 修改 变更规格通用操作,补充约束条件。 开启网卡多队列功能 2019-03-25 第三十四次正式发布。 新增 修改云服务器名称 开启网卡多队列功能章节,新增SUSE Enterprise 12 SP3 64bit。 2019-03-18 第三十三次正式发布。 修改 切换操作系统,补充“包年/包月”云服务器切换操作系统约束条件。 2019-03-04 第三十二次正式发布。 修改 元数据获取,修改元数据支持列表。 实例自定义数据注入,补充使用限制。 2019-02-28 第三十一次正式发布。 修改 弹性云服务器支持的基础监控指标,修改弹性云服务器监控指标。 2019-01-18 第三十次正式发布。 增加 GPU加速型实例安装GRID驱动 GPU加速型实例安装Tesla驱动及CUDA工具包。 (推荐使用)安装NVIDIA GPU驱动和CUDA工具包 2018-12-30 第二十九次正式发布。 修改 开启网卡多队列功能 修改FPGA加速型,FPGA加速型云服务器正式商用。 2018-12-06 第二十八次正式发布。 修改 管理云服务器组,支持在弹性云服务器创建成功后,对云服务器组中的弹性云服务器进行添加、移出操作。 2018-11-19 第二十七次正式发布。 增加 购买竞价计费型实例,竞价计费型实例功能在华南区公测。 购买GPU P1型云服务器 购买GPU P2v型云服务器 2018-11-16 第二十六次正式发布。 增加 动态获取IPv6地址 2018-10-26 第二十五次正式发布。 增加 按需转包年/包月,支持批量转包年/包月操作。 修改 开启网卡多队列功能,更新镜像支持列表。 2018-07-30 第二十四次正式发布。 增加 配额调整 修改 远程登录Linux弹性云服务器(SSH密钥方式)和远程登录Linux弹性云服务器(SSH密码方式),补充CoreOS镜像的登录用户名说明。 6.1-重置密码使用场景介绍(废弃) 更改安全组,支持在操作列下更改安全组。 无公网IP的弹性云服务器访问Internet 弹性云服务器支持的基础监控指标,下线监控指标“系统状态检查失败”。 2018-06-30 第二十三次正式发布。 修改 创建镜像,华南、香港区域支持开机状态下制作镜像。 导出弹性云服务器列表信息,支持导出部分弹性云服务器信息。 切换操作系统,修改前提条件,重装失败的云服务器支持切换操作系统。 2018-05-30 第二十二次正式发布。 增加 购买相同配置云服务器 审计 修改 “密钥管理服务(KMS)”更名为“ 数据加密 服务(DEW)”。 “弹性IP”更名为“弹性公网IP”。 元数据获取,修改“local-ipv4”和“public-ipv4”的描述。 实例自定义数据注入,新增User-Data脚本的介绍。 弹性云服务器支持的基础监控指标,下线监控指标“系统状态检查失败”。 2018-04-30 第二十一次正式发布。 增加 查看失败任务 修改 远程登录Linux弹性云服务器(VNC方式),VNC界面支持复制粘贴功能。 变更规格通用操作,补充规格是否变更成功的查看方法。 查看监控指标 2018-04-05 第二十次正式发布。 增加 Linux弹性云服务器发生kdump时,操作系统无响应 2018-01-30 第十九次正式发布。 增加 上线I3型、H3型弹性云服务器 支持多Project 修改 变更规格通用操作,补充“后续处理”。 无公网IP的弹性云服务器访问Internet 标签概述,系统不再默认创建内置标签。 2017-12-30 第十七次正式发布。 修改 远程登录Windows弹性云服务器(VNC方式),补充FPGA加速型弹性云服务器的登录方法。 2017-12-12 第十六次正式发布。 增加 导出弹性云服务器列表信息,支持导出弹性云服务器列表。 修改 “通用型”弹性云服务器更名为“通用计算型”弹性云服务器。 “高计算型”弹性云服务器根据是否使用IB网卡,划分为“超高性能计算型”和“高性能计算型”弹性云服务器。 实例自定义数据注入,增加使用场景3。 远程登录Linux弹性云服务器(SSH密钥方式),增加使用Xshell进行登录。 未安装重置密码插件且忘记密码时,如何重置密码(Linux),增加lvm的说明。 弹性云服务器支持的基础监控指标,增加支持列表。 2017-11-30 第十五次正式发布。 增加 中国华北区上线S2型弹性云服务器。 在控制台重置弹性云服务器密码 支持标签功能。 修改 “密集存储型”弹性云服务器更名为“磁盘增强型”弹性云服务器。 “图形加速基础型”弹性云服务器更名为“图形加速基础型(G1)”弹性云服务器。 “计算加速型”弹性云服务器更名为“计算加速型(P1)”弹性云服务器。 2017-10-18 第十四次正式发布。 增加 G1型弹性云服务器 修改 重装操作系统,支持实例自定义数据注入。 切换操作系统,支持实例自定义数据注入。 变更规格通用操作中“管理虚拟IP地址”的内容。 在线卸载磁盘 2017-09-30 第十三次正式发布。 增加 中国华南区支持H2型、M2型云服务器 2017-08-15 第十次正式发布。 增加 云服务器组功能 云服务器冻结功能 支持使用加密镜像、加密云硬盘 P1型云服务器 修改 切换操作系统,“包年/包月”方式购买的弹性云服务器,支持切换操作系统。 变更规格通用操作,“包年/包月”方式购买的弹性云服务器,支持添加“包年/包月”方式的云硬盘。 2017-05-25 第九次正式发布。 增加 MTU配置功能 支持给弹性云服务器添加多个安全组 支持数据盘使用共享云硬盘 支持设备类型为SCSI的数据盘 修改 6.1-重置密码使用场景介绍(废弃) 2017-03-06 第八次正式发布。 增加 中国华北区的内存优化型弹性云服务器支持规格m1.8xlarge。 修改 高计算型弹性云服务器支持的规格。 2017-02-15 第七次正式发布。 增加 2017-01-09 第五次正式发布。 修改 重装、切换弹性云服务器操作系统功能,支持更换Keypair。 弹性云服务器初始化和访问弹性云服务器元数据时的安全组规则。 2016-11-28 第四次正式发布。 增加 中国华东区、华南区支持Cloud-init特性 2016-10-29 第三次正式发布。 增加 GPU优化型弹性云服务器 密集存储型弹性云服务器 高计算型弹性云服务器 修改 弹性云服务器的登录方式 2016-07-15 第二次正式发布。 增加 强制关机功能 强制重启功能 切换操作系统功能 修改 重装操作系统功能 2015-10-15 第一次正式发布。
  • 获取安装脚本 您可以通过以下地址,下载获取新版支持CES监控Agent的安装脚本。 表2 安装脚本的支持区域及获取地址 区域 安装脚本 华北-北京一 https://uniagent-cn-north-1.obs.cn-north-1.myhuaweicloud.com/package/install_amd64.exe 华北-北京四 https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/install_amd64.exe 华北-乌兰察布一 http://obs.cn-north-9.myhuaweicloud.com/uniagent-cn-north-9/package/install_amd64.exe 华南-广州 https://uniagent-cn-south-1.obs.cn-south-1.myhuaweicloud.com/package/install_amd64.exe 华东-上海一 https://uniagent-cn-east-3.obs.cn-east-3.myhuaweicloud.com/package/install_amd64.exe 华东-上海二 https://uniagent-cn-east-2.obs.cn-east-2.myhuaweicloud.com/package/install_amd64.exe 西南-贵阳一 https://uniagent-cn-southwest-2.obs.cn-southwest-2.myhuaweicloud.com/package/install_amd64.exe 中国-香港 https://uniagent-ap-southeast-1.obs.ap-southeast-1.myhuaweicloud.com/package/install_amd64.exe 亚太-曼谷 https://uniagent-ap-southeast-2.obs.ap-southeast-2.myhuaweicloud.com/package/install_amd64.exe 亚太-新加坡 https://uniagent-ap-southeast-3.obs.ap-southeast-3.myhuaweicloud.com/package/install_amd64.exe 亚太-雅加达 https://obs.ap-southeast-4.myhuaweicloud.com/uniagent-ap-southeast-4/package/install_amd64.exe 非洲-约翰内斯堡 https://uniagent-af-south-1.obs.af-south-1.myhuaweicloud.com/package/install_amd64.exe 拉美-墨西哥城二 https://uniagent-la-south-2.obs.la-south-2.myhuaweicloud.com/package/install_amd64.exe 拉美-圣地亚哥 https://uniagent-la-north-2.obs.la-north-2.myhuaweicloud.com/package/install_amd64.exe
  • 约束与限制 仅支持Windows操作系统,且仅部分Windows镜像版本支持GPU监控。 表1 支持GPU监控的Windows版本 类型 版本 Windows(64bit) Windows Server 2016 标准版 64位 Windows Server 2016 数据中心版 64位 Windows Server 2019 标准版 64位 Windows Server 2019 数据中心版 64位 支持的规格:G6v、G6、P2s、P2v、P2vs、Pi2、Pi1、P1。 不支持监听Windows类型GPU加速型实例的Xid事件。
  • 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 已安装GPU驱动,未安装GPU驱动的云服务器不支持采集GPU指标数据及上报事件。 如果您的弹性云服务器未安装GPU驱动,可参见(推荐)GPU加速型实例自动安装GPU驱动(Windows)。 安装GPU驱动需使用默认路径。 GPU驱动安装完后,需重启GPU加速型实例,否则可能导致采集GPU指标及上报GPU事件失败。 GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 需使用具有Administrator权限的账户进行安装,例如Administrator用户。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
  • 操作步骤 本操作以Windows Server 2019 标准版 64位操作系统、Pi2规格的GPU加速型实例为例,介绍单台ECS安装新版支持GPU监控的CES Agent的操作指导。 使用Administrator用户,远程登录弹性云服务器。 在浏览器地址栏输入地址,下载安装脚本。 以“华东-上海一”为例,安装脚本地址为: https://uniagent-cn-east-3.obs.cn-east-3.myhuaweicloud.com/package/install_amd64.exe 其余区域的安装脚本,请参见获取安装脚本。 (可选)在以下路径,卸载旧版本支持GPU监控的CES Agent。 C:\Program Files\uniagent\script\uninstall.bat 以管理员身份打开cmd命令窗口,在“install_amd64.exe”下载目录下,执行以下命令安装支持GPU监控的CES Agent安装脚本。 install_amd64.exe [-r RegionID] [-u UniagentVersion] [-t TelescopeVersion] [-d AgentApiDomain] 命令示例: install_amd64.exe -r cn-east-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com 其中, RegoinID:cn-east-3 UniagentVersion:0.1.5 TelescopeVersion:2.6.7.1 AgentApiDomain:agent.ces.myhuaweicloud.com 如果命令执行后出现“Access is denied”,可能是由于未以管理员身份打开cmd命令窗口导致,请切换为管理员身份重新执行命令。 当界面显示“Install service success”或“Install agent successfully”时,说明支持GPU监控的CES Agent安装成功并启动。 图1 支持GPU监控的CES Agent安装成功
  • 维度 维度 Key Value 云服务器 instance_id 云服务器ID。 云服务器 - 磁盘 disk 云服务器磁盘。 该取值可通过 云监控 服务的“查询主机监控维度指标信息”获取。 云服务器 - 挂载点 mount_point 云服务器磁盘的挂载点。 该取值可通过云监控服务的“查询主机监控维度指标信息”获取。 云服务器 - GPU gpu GPU类型云服务器中显卡。 该取值可通过云监控服务的“查询主机监控维度指标信息”获取。 云服务器 - NPU npu NPU类型云服务器中显卡。 该取值可通过云监控服务的“查询主机监控维度指标信息”获取。
  • 操作系统监控指标:NPU 表11 NPU类监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) npu_device_health NPU健康状况 该指标用于统计虚拟机上NPU卡的健康状态,是一个综合指标。 该指标无单位。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0:代表健康 1:代表存在一般告警 2:代表存在重要告警 3:代表存在紧急告警 云服务器 云服务器 - NPU 1分钟 npu_util_rate_mem NPU显存使用率 该指标用于统计该NPU的编码能力使用率。 单位:百分比 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_ai_core NPU卡AI核心使用率 该指标用于统计该NPU的AI核心使用率。 单位:百分比 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_ai_cpu NPU卡AI CPU使用率 该指标用于统计该NPU的AI CPU的使用率。 单位:百分比。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_ctrl_cpu NPU控制CPU使用率 该指标用于统计该NPU的控制CPU的使用率。 单位:百分比。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_mem_bandwidth NPU显存带宽使用率 该指标用于统计该NPU的显存的带宽使用率。 单位:百分比。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_freq_mem NPU显存频率 该指标用于统计该NPU的显存的时钟频率。 单位:兆赫兹(MHz)。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_freq_ai_core NPU卡AI核心频率 该指标用于统计该NPU AI核心的时钟频率。 单位:兆赫兹(MHz)。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_usage_mem NPU显存使用量 该指标用于统计该NPU 显存的使用量。 单位:兆Byte(MB)。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_sbe NPU单bit错误数量 该指标用于统计该NPU卡当前的单比特页错误的数量。 单位:个 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_dbe NPU双bit错误数量 该指标用于统计该NPU卡当前的多比特页错误的数量。 单位:个 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_power NPU功率 该指标用于统计该NPU卡的功率。其中,310卡仅支持显示额定功率,其余卡显示实际功率 单位:瓦(W) 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_temperature NPU温度 该指标用于统计该NPU卡当前的温度 单位:摄氏度(℃) 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 Windows系统暂不支持NPU类监控指标。
  • 操作系统监控指标:GPU 表10 GPU类监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) gpu_status gpu健康状态 该指标用于统计虚拟机上GPU健康状态,是一个综合指标。 该指标无单位。 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0:代表健康 1:代表亚健康 2:代表故障 云服务器 云服务器 - GPU 1分钟 gpu_usage_encoder 编码使用率 该指标用于统计该GPU的编码能力使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_usage_decoder 解码使用率 该指标用于统计该GPU的解码能力使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_volatile_correctable 可纠正ECC错误数量 该指标用于统计该GPU重置以来可纠正的ECC错误数量,每次重置后归0。 单位:个。 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_volatile_uncorrectable 不可纠正ECC错误数量 该指标用于统计该GPU重置以来不可纠正的ECC错误数量,每次重置后归0。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_aggregate_correctable 累计可纠正ECC错误数量 该指标用于统计该GPU累计的可纠正ECC错误数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_aggregate_uncorrectable 累计不可纠正ECC错误数量 该指标用于统计该GPU累计的不可纠正ECC错误数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_retired_page_single_bit retired page single bit错误数量 该指标用于统计该GPU当前卡隔离的单比特页的数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_retired_page_double_bit retired page double bit错误数量 该指标用于统计该GPU当前卡隔离的双比特页的数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_performance_state (Agent) 性能状态 该指标用于统计测量对象当前的GPU性能状态。 该指标无单位。 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 P0-P15、P32, P0:表示最大性能状态 P15:表示最小性能状态 P32:表示状态未知 云服务器 云服务器 - GPU 1分钟 gpu_usage_mem (Agent) 显存使用率 该指标用于统计测量对象当前的显存使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_usage_gpu (Agent) GPU使用率 该指标用于统计测量对象当前的GPU使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_free_mem GPU显存剩余量 该指标用于统计测量对象当前的GPU显存剩余量。 单位:MB 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MB 云服务器 云服务器 - GPU 1分钟 gpu_graphics_clocks GPU显卡时钟频率 该指标用于统计测量对象当前的GPU显卡(着色器)时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟 gpu_mem_clocks GPU内存时钟频率 该指标用于统计测量对象当前的GPU内存时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟 gpu_power_draw GPU功率 该指标用于统计测量对象当前的GPU功率。 单位:W 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 NA 云服务器 云服务器 - GPU 1分钟 gpu_rx_throughput_pci GPU PCI入方向带宽 该指标用于统计测量对象当前的GPU PCI入方向带宽。 单位:MByte/s 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MByte/s 云服务器 云服务器 - GPU 1分钟 gpu_sm_clocks GPU流式处理器时钟频率 该指标用于统计测量对象当前的GPU流式处理器时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟 gpu_temperature GPU温度 该指标用于统计测量对象当前的GPU温度。 单位:℃ 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 ℃ 云服务器 云服务器 - GPU 1分钟 gpu_tx_throughput_pci GPU PCI出方向带宽 该指标用于统计测量对象当前的GPU PCI出方向带宽。 单位:MByte/s 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MByte/s 云服务器 云服务器 - GPU 1分钟 gpu_used_mem GPU显存使用量 该指标用于统计测量对象当前的GPU显存使用量。 单位:MB 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MB 云服务器 云服务器 - GPU 1分钟 gpu_video_clocks GPU视频时钟频率 该指标用于统计测量对象当前的GPU视频(包含编解码)时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟
共100000条