华为云用户手册

  • APM JAVA探针支持操作系统 表4 APM JAVA探针(2.4.1版本)支持操作系统 探针类型 CPU架构 vCPUs 内存 规格名称 操作系统 系统版本 结果 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 8.1 64bit for GPU 支持 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 7.6 64bit for Tenant 20230712 支持 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 7.3 64bit 支持 自研探针 x86计算 4 16 Sit3.xlarge.4 CentOS CentOS 7.4 64bit 支持 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 6.8 64bit 支持 自研探针 x86计算 2 4 s2rm.2u.4g Debian Debian 11.1.0 64bit for Tenant 20221227 支持 自研探针 x86计算 2 4 s2.large.2 Ubuntu Ubuntu 22.04 server 64bit for Tenant 20230713 支持 自研探针 x86计算 2 4 s2.large.2 Ubuntu Ubuntu 16.04 server 64bit 支持 自研探针 x86计算 2 4 s2.large.2 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 Standard 64 bit for Tenant 20230606 base 2.0.2303.1 支持 自研探针 x86计算 2 4 s2.large.2 Huawei Cloud EulerOS Huawei Cloud EulerOS 1.1 for CentOS 64 bit for op5 Tenant 20230217 base 1.1.2212.1 支持 自研探针 x86计算 2 4 s2.large.2 EulerOS EulerOS 2.9 64bit for Tenant 20230728 base 2.9.15 支持 自研探针 x86计算 2 4 s2.large.2 EulerOS EulerOS 2.5 64bit for Tenant 2023714 base 2.5.15 支持 自研探针 x86计算 2 4 s2.large.2 EulerOS EulerOS 2.2 64bit for Tenant 20210227 支持 自研探针 x86计算 2 4 s2.large.2 Windows Windows Server 2019 标准版 64位简体中文_40GB 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 Standard 64 bit for ARM for Tenant 20230411 base 2.0.2303.1(40GiB)(bf7488b4-d9b3-4314-b2a9-e39094f573d2) 支持(默认jdk11.0.17) 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS CentOS 7.6 64bit with ARM 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS CentOS 7.5 64bit with ARM(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS CentOS 7.4 64bit with ARM(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS Kylin Linux Advanced Server (Kunpeng) V10(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 Ubuntu Ubuntu 18.04 64bit with ARM(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 EulerOS EulerOS 2.9 64bit with ARM for Tenant 20230419 base 2.9.14 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 EulerOS EulerOS 2.8 64bit with ARM for Tenant 20210309(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 EulerOS EulerOS 2.10 64bit with ARM for Tenant 20230404 base 2.10.7 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 Fedora Fedora 29 64bit with ARM(40GiB) 支持
  • APM支持的JAVA类型 APM支持JAVA类应用,目前已支持多种主流Java框架、web服务器、通讯协议、数据库等,可实现应用轻松接入。 表1 自研探针JAVA组件和框架 探针类型 组件 JDK 1.8 JDK 17 JDK 11 JDK 21 自研探针 Dubbo 2.6.x 2.6.x 2.6.x 2.6.x 自研探针 Jedis 2.x.x-3.x.x 2.x.x-3.x.x 2.x.x-3.x.x 2.x.x-3.x.x 自研探针 Lettuce 5.x.x 5.x.x 5.x.x 5.x.x 自研探针 servicecomb 2.x.x - - - 自研探针 log4j 1.x.x 1.x.x 1.x.x 1.x.x 自研探针 log4j2 2.x.x 2.x.x 2.x.x 2.x.x 自研探针 httpclient 4.x.x 4.x.x~5.3.x(5.x.x仅支持同步场景) 4.x.x~5.3.x(5.x.x仅支持同步场景) 4.x.x~5.3.x(5.x.x仅支持同步场景) 自研探针 mariadb 2.x.x 2.x.x 2.x.x 2.x.x 自研探针 mysql 5.x.x、8.x.x 5.x.x、8.x.x 5.x.x、8.x.x 5.x.x、8.x.x 自研探针 okhttpclient 3.x.x 3.x.x 3.x.x 3.x.x 自研探针 tomcat 6.x.x 9.x.x 9.x.x 9.x.x 自研探针 grpc 1.x.x 1.x.x 1.x.x 1.x.x 自研探针 mongodb 3.x.x~4.x.x 3.x.x~4.x.x 3.x.x~4.x.x 3.x.x~4.x.x 自研探针 c3p0 0.9.x 0.9.x 0.9.x 0.9.x 自研探针 cassandra3 3.x.x 3.x.x 3.x.x 3.x.x 自研探针 dbcp 2.x.x 2.x.x 2.x.x 2.x.x 自研探针 druid 1.1.x 1.1.x 1.1.x 1.1.x 自研探针 httpasyncclient 4.x.x 4.x.x 4.x.x 4.x.x 自研探针 jettyclient 9.x.x 9.x.x 9.x.x 9.x.x 自研探针 mariadb3 3.x.x 3.x.x 3.x.x 3.x.x 自研探针 mybatis 3.x.x 3.x.x 3.x.x 3.x.x 自研探针 postgresql 42.x.x 42.x.x 42.x.x 42.x.x 自研探针 rabbitmq 5.x.x 5.x.x 5.x.x 5.x.x 自研探针 websocket 9.x.x 9.x.x 9.x.x 9.x.x 自研探针 elasticsearch 7.x.x 7.x.x 7.x.x 7.x.x 自研探针 oracle 10.x.x 10.x.x 10.x.x 10.x.x 自研探针 rocketmq 4.x.x 4.x.x 4.x.x 4.x.x 自研探针 kafka 2.x.x 2.x.x 2.x.x 2.x.x 自研探针 GaussDB 1.0.2.SPC180.B003 1.0.2.SPC180.B003 1.0.2.SPC180.B003 1.0.2.SPC180.B003 自研探针 springCloudGateway 2.1.x~3.1.x - - - 自研探针 redisson 3.12.x~3.26.x 3.13.x~3.26.x 3.13.x~3.26.x 3.13.x~3.26.x 表2 skywalking探针JAVA组件信息 探针类型 组件 版本 skywalking探针 Tomcat 7~10 skywalking探针 Spring Boot Web 4.x skywalking探针 Spring MVC 3.x, 4.x 5.x with servlet 3.x skywalking探针 Spring MVC 6.x skywalking探针 Nutz Web Framework 1.x skywalking探针 Struts2 MVC 2.3.x~2.5.x skywalking探针 Resin 3~4 skywalking探针 Jetty Server 9.x~11.x skywalking探针 Spring WebFlux 5.x skywalking探针 Undertow 1.3.0~2.0.27 skywalking探针 RESTEasy 3.1.0~6.2.4 skywalking探针 Play Framework 2.6.x~2.8.x skywalking探针 Light4J Microservices Framework 1.6.x~2.x skywalking探针 Netty SocketIO 1.x skywalking探针 Micronaut HTTP Server 3.2.x~3.6.x skywalking探针 Jersey REST framework 2.x~3.x skywalking探针 Grizzly 2.3.x~4.x skywalking探针 WebSphere Liberty 23.x skywalking探针 Feign 9.x skywalking探针 Netflix Spring Cloud Feign 1.1.x~2.x skywalking探针 Okhttp 2.x~4.x skywalking探针 Spring RestTemplate 6.x skywalking探针 Jetty Client 9.x~11.x skywalking探针 Apache httpcomponent AsyncClient 4.x skywalking探针 AsyncHttpClient 2.1+ skywalking探针 JRE HttpURLConnection (Optional²) - skywalking探针 Hutool-http client 5.x skywalking探针 Micronaut HTTP Client 3.2.x~3.6.x skywalking探针 Spring Cloud Gateway 2.0.2.RELEASE~3.x skywalking探针 Apache ShenYu 2.4.x skywalking探针 Mysql Driver 5.x, 6.x, 8.x skywalking探针 H2 Driver 1.3.x~1.4.x skywalking探针 ShardingSphere 3.0.0, 4.0.0, 4.0.1, 4.1.0, 4.1.1, 5.0.0 skywalking探针 PostgreSQL Driver 8.x, 9.x, 42.x skywalking探针 Mariadb Driver 2.x, 1.8 skywalking探针 InfluxDB 2.5~2.17 skywalking探针 Mssql-Jtds 1.x skywalking探针 Mssql-jdbc 6.x~8.x skywalking探针 ClickHouse-jdbc 0.3.x skywalking探针 Apache-Kylin-Jdbc 2.6.x~ 4.x skywalking探针 Impala-jdbc 2.6.x skywalking探针 Dubbo 2.5.4~2.7.0 skywalking探针 Dubbox 2.8.4 skywalking探针 Apache Dubbo 2.7.x~3.x skywalking探针 Motan 0.2.x~1.1.0 skywalking探针 gRPC 1.x skywalking探针 Apache ServiceComb Java Chassis 1.x, 2.x skywalking探针 SOFARPC 5.4.0 skywalking探针 Armeria 0.63.0~1.22.0 skywalking探针 Apache Avro 1.7.0~1.8.x skywalking探针 Finagle 6.44.0~20.1.0 skywalking探针 Brpc-Java 2.3.7~3.0.5 skywalking探针 JSONRPC4J 1.2.0~1.6 skywalking探针 Nacos-Client 2.x skywalking探针 RocketMQ 3.x~5.x skywalking探针 RocketMQ-gRPC 5.x skywalking探针 Kafka 0.11.0.0~3.2.3 skywalking探针 Spring Kafka Consumer 1.3.x~2.3.x skywalking探针 ActiveMQ 5.10.0~5.15.4 skywalking探针 RabbitMQ 3.x~5.x skywalking探针 Pulsar 2.2.x~2.9.x skywalking探针 NATS 2.14.x~2.15.x skywalking探针 Aliyun ONS 1.x skywalking探针 aerospike 3.x~6.x skywalking探针 Jedis 2.x~4.x skywalking探针 redisson Easy Java Redis client 3.5.2+ skywalking探针 Lettuce 5.x skywalking探针 MongoDB Java Driver 2.13~2.14, 3.4.0~3.12.7, 4.0.0~4.1.0 skywalking探针 Spymemcached 2.x skywalking探针 Xmemcached 2.x skywalking探针 transport-client 5.2.x~5.6.x,6.2.3~6.8.4,7.0.0-7.5.2 skywalking探针 rest-high-level-client 6.7.1~6.8.4,7.0.0~7.5.2 skywalking探针 SolrJ 7.x skywalking探针 cassandra-java-driver 3.7.0~3.7.2 skywalking探针 hbase-client HTable 1.0.0-2.4.2 skywalking探针 Neo4j-java 4.x skywalking探针 Zookeeper 3.4.x skywalking探针 Spring Bean annotations 3.x~4.x skywalking探针 Spring Core Async SuccessCallback/FailureCallback/ListenableFutureCallback 4.x skywalking探针 Spring Transaction 4.x~5.x skywalking探针 Hystrix 1.4.20~1.5.18 skywalking探针 Sentinel 1.7.0~1.8.1 skywalking探针 Elastic Job 2.x skywalking探针 Apache ShardingSphere-Elasticjob 3.x skywalking探针 Spring @Scheduled 3.1+ skywalking探针 Quartz Scheduler 2.x skywalking探针 XXL Job 2.x skywalking探针 Canal 1.0.25~1.1.2 skywalking探针 GSON 2.8.x skywalking探针 Fastjson 1.2.x skywalking探针 Jackson 2.x skywalking探针 Vert.x Eventbus 3.2~4.x skywalking探针 Vert.x Web 3.x~4.x skywalking探针 Spring 4.x~5.x skywalking探针 Quasar 0.7.x skywalking探针 Ehcache 2.x skywalking探针 GuavaCache 18.~23.x skywalking探针 Coroutine 1.0.1~1.3.x skywalking探针 Graphql 8.0~17.x skywalking探针 Alibaba Druid 1.x skywalking探针 HikariCP 3.x~4.x skywalking探针 log4j 2.x skywalking探针 log4j2 1.2.x skywalking探针 logback 1.2.x skywalking探针 MyBatis 3.4.x~3.5.x skywalking探针 GuavaEventBus 19.x~31.x-jre skywalking探针 Undertow 2.1.x~2.6.x skywalking探针 Grizzly 2.3.x~4.x skywalking探针 Jetty 9.1.x~11.x 表3 Opentelemetry探针JAVA组件信息 探针类型 组件 版本 opentelemetry探针 Dubbo 2.7+ opentelemetry探针 Jedis 1.4+ opentelemetry探针 Lettuce 4.0+ opentelemetry探针 log4j 1.2+ opentelemetry探针 log4j2 2.11+ opentelemetry探针 httpclient 2.0+ opentelemetry探针 tomcat 7.0.x, 8.5.x, 9.0.x, 10.0.x opentelemetry探针 jetty 9.4.x, 10.0.x, 11.0.x opentelemetry探针 grpc 1.6+ opentelemetry探针 mongodb 3.1+ opentelemetry探针 redisson 3.0+ opentelemetry探针 c3p0 0.9.2+ opentelemetry探针 cassandra3 3.0+ opentelemetry探针 dbcp 2.0+ opentelemetry探针 httpasyncclient 4.1+ opentelemetry探针 jettyclient 9.2+(not including 10+ yet) opentelemetry探针 netty 3.8+ opentelemetry探针 rabbitmq 2.7+ opentelemetry探针 undertow 1.4+ opentelemetry探针 elasticsearch 5.0+ opentelemetry探针 oracle 11.2+ opentelemetry探针 rocketmq 4.8+ opentelemetry探针 kafka 2.7+
  • 自定义统计采集 自定义统计采集(AppEvent)是自定义统计采集器,获取自定义统计相关信息。包括:类别、指标、指标名称、指标说明、单位、数据类型以及默认聚合方式。 表1 自定义统计采集(AppEvent)指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 自定义统计指标集(Event,自定义统计指标集相关信息。) total 自定义事件总次数 自定义事件总次数 - INT SUM k 自定义事件名 自定义事件名 - STRING LAST v 最后一次事件值 最后一次事件值 - STRING LAST avgV2 内容平均事件值 内容平均事件值 - DOUBLE AVG maxV2 内容最大事件值 内容最大事件值 - DOUBLE MAX minV2 内容最小事件值 内容最小事件值 - DOUBLE MIN 父主题: App
  • NodeJsHttpClient监控 介绍APM采集的HttpClient监控指标的类别、名称、含义等信息。 表1 NodeJsHttpClient监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,httpclient调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace stackTrace 该异常产生的堆栈信息 - CLOB LAST 集群指标(hostInvocation,根据被调用方的集群维度统计httpclient接口调用信息) envId 集群id 被调用方的集群id - ENUM LAST hostUri 调用地址 被调用的地址 - STRING LAST errorCount 错误次数 调用该集群url发生的错误次数 - INT SUM invokeCount 调用次数 调用该集群url的调用次数 - INT SUM maxTime 最大响应时间 调用该集群url的最大响应时间 - INT MAX totalTime 总响应时间 调用该集群url的总响应时间 - INT SUM responseCloseCount 关闭响应数 调用该集群url的关闭响应数 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM ranges 自定义响应时间区间 自定义响应时间区间 - STRING LAST url监控(invocation,以被调用的url为维度统计接口调用信息。) url url 被调用url - ENUM LAST method httpmethod url的httpmethod - ENUM LAST client 客户端类型 httpclient客户端的类型 - ENUM LAST concurrentMax 最大并发 被调用url的最大并发 - INT MAX errorCount 错误次数 被调用url的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST hostUri 调用地址 被调用url的调用地址 - STRING LAST invokeCount 调用次数 被调用url的调用次数 - INT SUM lastError 错误信息 url发生错误时产生的错误信息 - STRING LAST maxTime maxTime 被调用url的最大响应时间 - INT MAX responseCloseCount responseCloseCount 被调用url的关闭响应数 - INT SUM totalTime 总响应时间 被调用url的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM ranges 自定义响应时间区间 自定义响应时间区间 - STRING LAST envId 集群id 被调用的url对应的集群id - STRING LAST 状态码统计(code,根据状态码维度统计接口调用信息。) code 状态码 状态码 - ENUM LAST url url 产生对应状态码的url - STRING LAST count 次数 对应状态码的发生次数 - INT SUM httpclient汇总(total,httpclient接口调用的汇总信息统计。) errorCount 错误次数 总的错误次数 - INT SUM invokeCount 调用次数 总的调用次数 - INT SUM responseCloseCount 关闭响应数 总的关闭响应数 - INT SUM totalTime 总响应时间 总响应时间 - INT SUM 父主题: 外部调用
  • 卡顿监控采集 卡顿监控采集(AppAnr)是卡顿监控采集器,获取卡顿监控相关信息。包括:类别、指标、指标名称、指标说明、单位、数据类型以及默认聚合方式。 表1 卡顿监控采集(AppAnr)指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 卡顿指标集(Congestion ,卡顿指标集相关信息。) total 卡顿总量 卡顿总量 - INT SUM deviceCount 卡顿设备总量 卡顿设备总量 - INT SUM kd 最后一次卡顿类型 最后一次卡顿类型 - STRING LAST 父主题: App
  • 自定义统计采集 自定义统计采集(WebEvent)是自定义统计采集器,获取自定义统计相关信息。包括:类别、指标、指标名称、指标说明、单位、数据类型以及默认聚合方式。 表1 自定义上报采集(WebEvent)指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 自定义统计指标集(CustomEvent,自定义统计指标集相关信息。) total 触发总次数 触发总次数 - INT SUM url 最后一次页面加载的url 最后一次页面加载的url - STRING LAST customKey 事件名 事件名 - STRING LAST strVal 事件值 事件值 - STRING LAST pv PV总量 PV总量 - INT SUM uv UV总量 UV总量 - INT SUM avgNumVal 平均事件值 平均事件值 - DOUBLE AVG maxNumVal 最大事件值 最大事件值 - DOUBLE MAX minNumVal 最小事件值 最小事件值 - DOUBLE MIN 父主题: Web/H5
  • 流量(PV/UV)采集 流量(PV/UV)采集(WebPvUv),WEB流量采集器,获取PV和UV相关信息指标。包括:类别、指标、指标名称、指标说明、单位、数据类型以及默认聚合方式。 表1 流量(PV/UV)采集指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 PV指标集(PV,PV指标集相关信息。) url PV最后一次的URL PV最后一次的URL - STRING LAST title PV最后一次的标题 PV最后一次的标题 - STRING LAST pv PV总量 PV总量 - INT SUM UV指标集(UV,UV指标集相关信息。) url UV最后一次的URL UV最后一次的URL - STRING LAST title UV最后一次的标题 UV最后一次的标题 - STRING LAST uv UV总量 UV总量 - INT SUM 父主题: Web/H5
  • 探针监控 本章节介绍APM采集的探针监控指标的类别、名称、含义等信息。 表1 探针监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 探针数据(detail,探针数据指标集。) type 数据类型 探针上报的数据类型 - ENUM LAST discardBytes 丢弃字节数 该数据类型的丢弃字节数 Byte INT SUM discardCount 丢弃次数 该数据类型的丢弃次数 - INT SUM errorBytes 发送失败字节数 该数据类型的发送失败字节数 Byte INT SUM errorCount 发送失败次数 该数据类型的发送失败次数 - INT SUM maxBytes 最大字节数 该数据类型的最大发送字节数 Byte INT MAX maxQueueSize 队列最大长度 该数据类型发送队列最大长度 - INT MAX sendBytes 发送成功字节数 该数据类型发送成功字节数 Byte INT SUM sendCount 发送成功次数 该数据类型发送成功次数 - INT SUM sendTotalTime 总发送时间 该数据类型的总发送时间 ms INT SUM slowTime 最慢发送时间 该数据类型最慢发送时间 ms INT MAX 异常(exception,异常指标集。) causeType 异常类 异常发生类 - ENUM LAST type 类型 异常类型 - ENUM LAST count 次数 异常次数 - INT SUM message 消息 异常消息 - STRING LAST stackTrace 堆栈 异常堆栈 - CLOB LAST 服务端连接监控(transfer,服务端连接监控指标集。) host 主机 主机信息 - ENUM LAST connectIp 连接ip 连接ip - STRING LAST ipList ip列表 所有ip列表 - STRING LAST isConnected 是否连接 是否连接 - INT LAST rt 响应时间 响应时间 ms INT AVG 队列监控(repository,队列监控指标集。) monitorQueueSize 监控数据队列大小 监控数据队列大小 - INT SUM monitorObjectSize 监控数据内存大小 监控数据内存大小 - INT SUM traceQueueSize 调用链数据队列大小 调用链数据队列大小 - INT SUM traceObjectSize 调用链数据内存大小 调用链数据内存大小 - INT SUM 父主题: 指标总览
  • 通信协议 本章节介绍APM采集的Websocket监控指标的类别、名称、含义等信息。 表1 Websocket监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,Websocket的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST websocket消息监控(message,websocket消息处理信息。) url url websocket对应的url - ENUM LAST errorCount 错误次数 消息处理错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST invokeCount 调用次数 消息处理方法调用次数 - INT SUM traffic 流量 流量 - INT SUM createSessionCount 创建连接数 创建连接数 - INT SUM closeSessionCount 关闭连接数 关闭连接数 - INT SUM closeReason 关闭原因 连接关闭的原因 - STRING LAST maxTime 最大响应时间 最大响应时间 - INT MAX totalTime 总响应时间 总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM Websocket汇总(total,汇总信息统计。) errorCount 错误次数 总的错误次数 - INT SUM invokeCount 调用次数 总的调用次数 - INT SUM createSessionCount 创建连接数 创建连接数 - INT SUM closeSessionCount 关闭连接数 关闭连接数 - INT SUM traffic 流量 流量 - INT SUM totalTime 总响应时间 总响应时间 - INT SUM 父主题: 指标总览
  • 产品规格差异 APM产品规格包括免费版和企业版,当前支持Java应用接入APM。APM支持免费版升级至企业版,不支持企业版降级回免费版(基础版)。各版本支持的功能详见下表。 版本 免费版 企业版 版本说明 完全免费,最多可接入10个Agent在线。 所有功能完全开放。 数据存储时长 7天 30天 应用拓扑 √ √ 调用链 链路追踪调用链公测期间仅支持2天存储,其它场景支持7天存储。 √ 指标监控 √ √ URL跟踪分析 √ √ 告警 √ √ CMDB √ √ 说明(是否支持,√表示支持,x表示不支持)
  • URL监控 介绍APM采集的URL监控指标的类别、名称、含义等信息。 表1 URL监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 拦截header指定key值 array JAVA - 2.0.0 - 拦截header中指定key值的内容。 拦截url参数指定key值 array JAVA - 2.0.0 - 拦截url参数指定key值的内容。 拦截cookie指定key值 array JAVA - 2.0.0 - 拦截cookie指定key值的内容。 url采集配置 obj_array JAVA - 2.0.0 - url采集配置,将restful风格url按配置进行规整;规整方式包含startwith,endwith,include,regex四种方式。 采集黑名单配置 obj_array JAVA - 2.0.0 - 指定规则匹配的url不采集,匹配方式包含startwith,endwith,include,regex四种方式。 业务code采集长度限制 integer JAVA 0 2.0.0 - 解析业务code需要采集body内容的长度限制。 解析业务code的key array JAVA - 2.0.0 - 解析json格式的body内容的key,获取业务状态码。 业务code的正确值 array JAVA - 2.0.0 - 配置正确的业务状态码的值,业务状态码不在该范围的值定义为错误的调用链。 慢请求阈值定义 integer JAVA 800 2.0.0 - 定义慢请求阈值,超过该阈值的url会定义为慢url,默认提高调用链采样率。 url配置 obj_array JAVA - 2.0.0 - 单独配置每个url的慢请求阈值和采样率;采样方式包含2.百分比采样;3.每分钟固定数量采样;4.自动采样三种采样方式。 错误状态码定义 radio JAVA 500 2.0.0 - 设置统计为错误的状态码范围。 Url自动规整 radio JAVA false 2.3.11 - Url自动规整。 url最大采集行数 integer JAVA 500 2.4.1 - 允许url最大采集行数 表2 URL监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 汇总(total ,url接口调用汇总统计数据。) errorCount 错误次数 总错误次数 - INT SUM invokeCount 调用次数 总调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM satisfiedCount 满意请求数 满意请求数 - INT SUM toleratingCount 可容忍请求数 可容忍请求数 - INT SUM 状态码(statuscode,以接口返回的状态码维度统计接口调用数据。) code 状态码 状态码 - ENUM LAST count 调用次数 该状态码的发生次数 - INT SUM url 采样url 该状态码在采集周内采样的url - STRING LAST url监控(url,以url维度统计接口调用数据。) url url 请求的url - ENUM LAST method httpmethod 请求的httpmethod - ENUM LAST concurrentMax 最大并发 该url的最大并发 - INT MAX errorCount 错误数 该url的错误数 - INT SUM invokeCount 调用次数 该url的调用次数 - INT SUM lastError 错误信息 该url发生错误时产生的错误信息 - STRING LAST maxTime 最大响应时间 该url在采集周期内最大响应时间 ms INT MAX maxTimeNativeUrl 最慢url 该url在采集周期内最慢url - STRING LAST runningCount 正在执行数 该url在采集时间点正在执行数量 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM totalTime 总响应时间 该url的总响应时间 ms INT SUM isRoot 是否根调用 是否是根调用 - INT SUM satisfiedCount 满意请求数 满意请求数 - INT SUM toleratingCount 可容忍请求数 可容忍请求数 - INT SUM 集群调用(user,以调用方集群id维度统计接口调用数据。) clusterId 集群id 调用方的集群id - ENUM LAST invokeCount 调用次数 该集群的调用次数 - INT SUM total1xxCount 1xx次数 状态码为1xx的调用次数 - INT SUM total2xxCount 2xx次数 状态码为2xx的调用次数 - INT SUM total3xxCount 3xx次数 状态码为3xx的调用次数 - INT SUM total4xxCount 4xx次数 状态码为4xx的调用次数 - INT SUM total5xxCount 5xx次数 状态码为5xx的调用次数 - INT SUM totalTime 总响应时间 该集群调用的总响应时间 ms INT SUM errorCount 错误次数 该集群调用的错误次数 - INT SUM concurrentMax 最大并发 该集群的最大并发 - INT MAX maxTime 最大响应时间 该url在采集周期内最大响应时间 ms INT MAX 父主题: 接口调用
  • DubboConsumer监控 介绍APM采集的DubboConsumer监控指标的类别、名称、含义等信息。 表1 DubboConsumer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 方法调用(invocation,方法调用指标集。) serviceUniqueName serviceUniqueName 服务唯一标识(group+interface+version) - ENUM LAST method method 方法 - ENUM LAST lastError lastError 错误信息 - STRING LAST slowTraceId slowTraceId 慢调用traceId - STRING LAST errorTraceId errorTraceId 错误traceId - STRING LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX source source 调用源 - ENUM LAST 主机汇总(cluster,按照主机汇总指标集。) cluster cluster 主机 - ENUM LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX 返回码汇总(resultCode,返回码汇总指标集。) code code 返回码 - ENUM LAST count count 调用次数 - INT SUM lastMethod lastMethod 最近异常类型 - STRING LAST 汇总(total,汇总指标集。) lastError lastError 错误信息 - STRING LAST slowTraceId slowTraceId 慢调用traceId - STRING LAST errorTraceId errorTraceId 错误traceId - STRING LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX 线程池(threadPool,线程池指标集。) poolId poolId 线程池唯一标示 - ENUM LAST poolType poolType dubbo自定义线程池类型(fixed、cached、limited等) - STRING LAST activeCount activeCount 当前激活个数 - INT SUM corePoolSize corePoolSize 核心线程数 - INT SUM maximumPoolSize maximumPoolSize 最大核心线程数 - INT SUM poolSize poolSize 线程池大小 - INT SUM queueSize queueSize 等待队列大小 - INT SUM taskCount taskCount 任务数 - INT SUM 客户端版本(version ,客户端版本指标集。) version version 版本 - STRING LAST 父主题: 外部调用
  • Oracle数据库 介绍APM采集的Oracle数据库指标的类别、名称、含义等信息。 表1 Oracle数据库采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 是否采集原始sql radio JAVA false 2.2.9 - 调用链中是否采集上报带有参数内容的原始sql。 oracle最大采集行数 integer JAVA 500 2.4.1 - oracle最大采集行数 sql语句最大采集字节数 integer JAVA 2000 2.4.7 - sql语句最大采集字节数 表2 Oracle数据库指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 数据库连接(connection,以数据库为维度统计sql调用详情。) db 数据库 数据库名称 - ENUM LAST createdCount 创建连接数 该数据库创建连接数 - INT SUM currentCount 当前连接数 该数据库当前连接数 - INT SUM destroyedCount 销毁连接数 该数据库销毁连接数 - INT SUM errorCount 错误数 该数据库发生错误数 - INT SUM invokeCount 调用次数 该数据库的调用次数 - INT SUM maxTime 最大响应时间 该数据库的最大响应时间 - INT MAX range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM ranges 自定义响应时间区间 自定义响应时间区间 - STRING LAST readRowCount 读取行数 该数据库读取行数 - INT SUM updatedRowCount 更新行数 该数据库更新行数 - INT SUM totalTime 总响应时间 该数据库的总响应时间 - INT SUM slowestSql 最慢sql 该数据库在采集周期内的最慢sql - STRING LAST 异常(exception,以数据库为维度统计sql调用详情。) causeType 类名 异常发生类 - ENUM LAST exceptionType 异常类型 异常类型 - ENUM LAST count 次数 异常次数 - INT SUM message 消息 异常消息 - STRING LAST sql 异常sql 发生异常的sql - STRING LAST stackTrace 异常堆栈 异常产生的堆栈信息 - CLOB LAST 版本(version,Oracle的包版本信息。) version 版本 驱动包版本 - STRING LAST sql监控(sql,以sql为维度统计sql调用详情。) sql sql唯一标识 sql对应的唯一id,用于告警配置 - ENUM LAST concurrentMax 最大并发 该sql的最大并发 - INT MAX errorCount 错误次数 该sql的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount 调用次数 该sql的调用次数 - INT SUM lastError 错误信息 sql发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 该sql的最大响应时间 - INT MAX readRowCount 读取行数 该sql的读取行数 - INT SUM runningCount 正在执行数 采集时间点正在执行的sql数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST sqlString sql语句 sql语句 - STRING LAST totalTime 总响应时间 该sql的总响应时间 - INT SUM updatedRowCount 更新行数 该sql的更新行数 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM ranges 自定义响应时间区间 自定义响应时间区间 - STRING LAST 汇总total(total,sql调用的汇总数据统计。) invokeCount 调用次数 总调用次数 - INT SUM errorCount 错误次数 总错误次数 - INT SUM readRowCount 读取行数 总读取行数 - INT SUM totalTime 响应时间 总响应时间 - INT SUM updatedRowCount 更新行数 总更新行数 - INT SUM 父主题: 数据库
  • MoquetteBroker监控 介绍APM采集的MoquetteBroker监控指标的类别、名称、含义等信息。 表1 MoquetteBroker监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,MoquetteBroker调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST MoquetteBroker版本(version,MoquetteBroker版本。) version 版本 版本 - STRING LAST MoquetteBroker主题汇总(total,MoquetteBroker主题汇总信息统计。) msgSentCount 消息推送次数 总的消息推送次数 - INT SUM bytesSent 消息推送字节数 总消息推送字节数 - INT SUM msgReceivedCount 消息接收次数 总消息接收次数 - INT SUM bytesReceived 消息接收字节数 总消息接收字节数 - INT SUM MoquetteBroker主题维度监控(brokerTopic,MoquetteBroker主题维度监控。) topic 主题 主题 - ENUM LAST subscribeCount 订阅数 订阅数 - INT SUM msgSentCount 消息推送次数 消息推送次数 - INT SUM bytesSent 消息推送字节数 消息推送字节数 - INT SUM msgReceivedCount 消息接收次数 消息接收次数 - INT SUM bytesReceived 消息接收字节数 消息接收字节数 - INT SUM 父主题: 物联网
  • 异常日志 介绍APM采集的异常指标的类别、名称、含义等信息。 表1 异常采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 日志异常是否认为调用链异常 radio JAVA true 2.0.0 - 采集到了日志异常之后,是否将所属调用链数据标记为异常。 关联业务日志与TraceId radio JAVA false 2.3.19 - 关联业务日志与TraceId。 表2 异常指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常日志(exception,日志打印的所有异常等级日志的统计数据。) className 异常类 发生异常的所在类 - ENUM LAST exceptionType 异常类型 该异常的类型 - ENUM LAST logType 日志类型 该异常打印所属的日志类型 - ENUM LAST count 次数 异常发生的次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的异常堆栈 - CLOB LAST errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST 日志版本(logVersion,日志组件的包版本信息。) logType 日志类型 日志类型 - ENUM LAST version 日志版本 日志类型对应的版本 - STRING LAST 父主题: 指标总览
  • JVM信息 介绍APM采集的JVM信息指标的类别、名称、含义等信息。 表1 JVM信息指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 jvm基本信息(info,JVM和javaagent的基本信息数据统计。) arch cpu架构 cpu架构 - STRING LAST availableProcessors 处理器个数 处理器个数 - INT LAST classPath 类路径 类路径 - STRING LAST fileEncode 文件编码 JVM文件编码 - STRING LAST inputArguments 启动参数 JVM启动参数 - STRING LAST javaCollectorVersion 采集器版本 采集器的版本 - STRING LAST javaHome javaHome javaHome路径 - STRING LAST javaLibraryPath 类库路径 java类库路径 - STRING LAST javaSpecificationVersion 规范版本 java规范版本 - STRING LAST javaVersion 版本 java版本 - STRING LAST jvm 模式 模式 - STRING LAST name 名称 服务器和进程名字 - STRING LAST osName 操作系统名称 操作系统名称 - STRING LAST osVersion 操作系统版本 操作系统版本 - STRING LAST pid 进程号 进程号 - STRING LAST sdkVersion sdk版本 sdk版本 - STRING LAST specName 虚拟机规范名称 虚拟机规范的名字 - STRING LAST specVendor 虚拟机规范厂商 虚拟机规范的制定厂商 - STRING LAST specVersion 规范版本 规范的版本 - STRING LAST startTime 启动时间 JVM启动时间 - DATETIME LAST systemLoadAverage load值 系统平均load值 - DOUBLE LAST uptime 运行时间 虚拟机运行的时间 ms INT LAST vmName 虚拟机名称 虚拟机的名称 - STRING LAST vmVendor 虚拟机供应商 虚拟机的供应商 - STRING LAST vmVersion 虚拟机版本 虚拟机的版本 - STRING LAST 父主题: 基础监控
  • GC监控 介绍APM采集的GC监控指标的类别、名称、含义等信息。 表1 GC监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 gc统计信息(gc,gc统计信息。) fullGCCount fullgc次数 采集周期内fullgc的次数 - INT SUM fullGCCountTotal fullgc总次数 fullgc的累积次数 - INT SUM fullGCTime fullgc时间 采集周期内fullgc的时间 ms INT SUM fullGCTimeTotal fullgc总时间 fullgc的累积时间 ms INT SUM fullGCMBeanName fullgc回收器名称 fullgc回收器的名称 - STRING LAST youngGCCount younggc次数 采集周期内younggc的次数 - INT SUM youngGCCountTotal younggc总次数 younggc的累积次数 - INT SUM youngGCTime younggc时间 采集周期内younggc的时间 ms INT SUM youngGCTimeTotal younggc总时间 younggc的累积时间 ms INT SUM youngGCMBeanName younggc回收器名称 younggc回收器的名称 - STRING LAST gc详情统计信息(gcdetail,gc详情统计信息。) action gc类型 gc类型,分为major和minor两种 - ENUM LAST cause gc原因 发生gc的原因 - ENUM LAST name gc名称 gc回收器的名称 - STRING LAST count 次数 gc发生的次数 - INT SUM totalTime gc时间 gc消耗的时间 ms INT SUM maxTime gc最大时间 最慢一次gc消耗的时间 ms INT MAX detail gc详情 最慢一次gc的详细信息 - CLOB LAST 父主题: 基础监控
  • 数据采集 在使用APM服务过程中用户开启APM数据采集开关后,APM仅采集应用性能指标及调用链相关数据,不涉及个人隐私数据。所采集的数据仅用于应用的性能分析和故障诊断,不会用于其他商业目的。 APM服务针对用户数据上报设置租户级限流,分别对性能指标数据、调用链数据、事务数据、链路追踪指标数据、Profiler数据设置不同的限流阈值。超过阈值则触发限流,停止上报,返回429状态码。 表1 限流阈值 数据类型 性能指标数据 调用链数据 事务数据 链路追踪指标数据 Profiler数据 限流阈值 20000笔/10秒/租户 20000笔/10秒/租户 20000笔/10秒/租户 10000笔/分钟/租户 20000笔/10秒/租户 表2 数据采集 数据类型 采集数据 传输方式 存储方式 数据用途 时限 性能指标数据 JVM相关数据、异常、数据库、SQL语句以及中间件调用相关的数据。 通过WSS方式传输 APM服务端按照租户隔离存储 指标查看页面展示 免费版7天,企业版30天,到期彻底删除。 调用链数据 调用链event数据,包含中间件调用的相关数据。 通过WSS方式传输 APM服务端按照租户隔离存储 调用链前台查询展示 免费版7天,企业版30天,到期彻底删除。 资源信息 服务类型、服务名称、创建时间、删除时间、所在节点地址和服务发布端口。 通过WSS方式传输 APM服务端按照租户隔离存储 资源库前台查询展示 免费版7天,企业版30天,到期彻底删除。 资源属性 系统类型、系统启动事件、CPU个数、服务执行用户名称、服务进程id、服务的PodID、CPU标志、系统版本、服务使用的Web框架、JVM版本、时区、系统名称、采集器版本以及LastMail的Url。 通过WSS方式传输 APM服务端按照租户隔离存储 资源库前台查询展示 免费版7天,企业版30天,到期彻底删除。 链路追踪指标数据 分布式应用的完整调用链路,提供了拓扑、接口调用、数据库、异常等数据。 通过grpc方式传输 APM服务端按照租户隔离存储 链路追踪前台查看页面展示 链路追踪调用链公测期间仅支持2天存储,到期彻底删除。 其他采集数据存储时限:免费版7天,企业版30天,到期彻底删除。 前端性能指标数据 页面加载性能、JS错误数、服务流量、API请求相关数据。 通过https方式传输 APM服务端按照租户隔离存储 前端监控前台查看页面展示 免费版7天,企业版30天,到期彻底删除。 Profiler 应用程序运行过程中CPU、内存和延时的使用情况。 通过websocket方式传输 APM服务端按照租户隔离存储 指标查看页面展示 7天,到期彻底删除。 表3 采集项限制说明 采集项名称 最大值 监控项默认最大行数 500行 SQL 默认长度限制 2000字符 SQL Result Body体默认采集数量限制 100个 SQL Result Body体默认采集内容大小限制 999字符 Redis Body体默认长度限制 100字符 Mongo 最大集群数 10个 Mongo command默认长度限制 2000字符 Hbase command默认长度限制 500字符 Es RestClient上限 10个 Cassandra CQL默认长度限制 2000字符 Cassandra Session上限 10个 Kafka Mbean采集ObjectName上限 100个 Kafka ClientId对应IP缓存上限 100个 RabbitMq连接地址上限 20个 RabbitMq 每个地址最大缓存连接数 100个 RabbitMq Consumer上限 500个 RabbitMq 每个Consumer最大缓存Channel数 100个 RabbitMq 每个Channel没有ACK的消息数 3000条 RabbitMq 缓存的手动ACK Consumer个数 20个 RocketMq PID上限 20个 RocketMq ClientId上限 20个 Jetcd Tag最大长度 500字符 HttpClient连接池上限 10条 连接池调用链默认上报时间阈值 1毫秒 Dubbo Invocation长度限制 500字符 Dubbo Attachment长度限制 500字符 URL Body体默认长度限制 9999字符 URL 采集应用code body长度限制 0字符 Java Method Body体长度限制 8192字符
  • Tomcat监控 本章节介绍APM采集的Tomcat监控指标的类别、名称、含义等信息。 表1 Tomcat监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 tomcat信息(tomcatInfo,tomcat的包版本信息统计。) tomcatVersion tomcat版本 tomcat版本 - STRING LAST tomcat端口监控(tomcat,以tomcat端口为维度统计tomcat线程数和连接数信息。) name 端口名称 端口名称 - ENUM LAST currentThreadCount 当前线程数 该端口的当前线程数 - INT AVG currentThreadsBusy 当前繁忙线程数 该端口在采集时间点的当前繁忙线程数 - INT AVG currentThreadsBusyMax 最大繁忙线程数 该端口在采集周期内的最大繁忙线程数 - INT MAX maxThreads 最大线程数 该端口的最大线程数 - INT MAX maxConnections 最大连接数 该端口的最大连接数 - INT MAX connectionCount 当前连接数 该端口在采集时间点的当前连接数 - INT MAX connectionCountMax 最大连接数 该端口在采集周期内最大连接数 - INT MAX 父主题: 指标总览
  • 应用体验管理 业务痛点 在用户体验至上的互联网时代,即使后台业务稳定运行,仍然无法获悉用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。一个系统上线之后,访问时的大量报错导致用户无法正常使用,如果APM无法及时获知,就会导致流失大量用户,如果用户反馈页面的使用情况,APM能否第一时间复现用户的使用场景;能否知晓用户遇到的详细报错信息而快速修复。 业务实现 APM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。 应用KPI分析:吞吐量、时延、成功率指标分析,实时掌控用户体验健康状态,用户体验一览无遗。 全链路性能追踪:Web服务、缓存、数据库全栈跟踪,性能瓶颈轻松掌握。
  • Apdex Apdex全称是Application Performance Index,是由Apdex联盟开发的用于评估应用性能的工业标准。Apdex标准从用户的角度出发,将对应用响应时间的表现,转为用户对于应用性能的可量化范围为0-1的满意度评价。 Apdex的原理 Apdex定义了应用响应时间的门槛为T(即Apdex阈值,T由性能评估人员根据预期性能要求确定),然后根据应用响应时间结合T定义了三种不同的性能表现: Satisfied(满意):应用响应时间低于或等于T,比如T为1.5s,则一个耗时1s的响应结果则可以认为是satisfied的。 Tolerating(可容忍):应用响应时间大于T,但同时小于或等于4T。假设应用设定的T值为1s,则4*1=4s为应用响应时间的容忍上限。 Frustrated(烦躁期):应用响应时间大于4T。 APM如何计算Apdex APM中,Apdex阈值即请求响应达到满意程度的最大时间。应用响应时延即服务时延,Apdex取值范围为0~1,计算公式如下: Apdex=(满意样本+可容忍样本*0.5)/样本总数
  • 故障智能诊断 业务痛点 海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、组件和URL跟踪等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。 业务实现 APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当URL跟踪出现异常时,通过智能算法学习历史指标数据,多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,如资源、参数、调用结构,通过聚类分析找到问题根因。
  • CMDB配置管理数据库 CMDB全称是Configuration Management DataBase,通过CMDB,可以结构化的组织并展示应用相关的资源配置信息,方便用户对应用进行全方位的监控和管理。主要概念如下: 应用: 一个应用代表一个逻辑单元,是一个全局概念,各个region都可以看到相同的应用信息,比如一个租户下面比较独立的功能模块可以定义为一个应用。应用可以跟企业项目关联,也可以不关联,关联企业项目后,按企业项目的权限进行管理,如果不关联企业项目,那么按照 IAM 权限进行管理。 子应用:在一个应用下面可以创建多个子应用,主要起文件夹和管理的功能。子应用为全局概念,当前最多支持三层子应用。 组件:组件指一个应用程序或者微服务,为全局概念,一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。 环境:一个组件或者程序,由于部署不同的配置参数,形成多个环境。每个环境都有region属性,可以通过region信息实现环境的过滤,也可以在环境上打上一个或多个标签,通过标签进行环境过滤。 实例:实例是环境下的一个进程,名称由主机名+ip+实例名称组成。一个环境一般是部署在不同主机上或不同容器中,如果部署在同一主机上,会通过实例名称进行区分。 环境标签:环境标签是在环境上的一个属性,多个环境可能具有相同的标签,可以通过标签对环境进行过滤。标签也承载公共配置能力,比如在某个标签上设置的配置,各个具有标签的环境都共享。需注意环境标签定义在应用层面,也就是说一个标签只能添加在本应用下的环境,不能跨应用进行。
  • 应用异常诊断 业务痛点 分布式微服务架构下的应用,虽然丰富多样且开发效率高,但是给传统运维诊断技术带来了巨大挑战。以电商为例,主要遇到如下问题: 定位问题难 客服人员接到用户反馈商品购买出现问题后,会交由技术人员排查解决。而微服务分布式架构中的一个业务请求通常要经过多个服务/节点后返回结果。一旦请求出现错误,往往要在多台机器上反复翻看日志才能初步定位问题,对简单问题的排查也常常涉及多个团队。 架构梳理难 在业务逻辑变得逐渐复杂以后,很难从代码层面去梳理某个应用依赖了哪些下游服务(数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如:某活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。 业务实现 APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。 可视化拓扑:应用拓扑自发现,异常应用实例无处躲藏。 调用链追踪:发现异常应用后,通过调用链一键下钻,代码问题根因清晰可见。 慢SQL分析:提供数据库、SQL语句的调用次数、响应时间、错误次数等关键指标视图,支持异常SQL语句导致的数据库性能问题分析。
  • 应用拓扑 应用拓扑是针对应用的调用关系和依赖关系的可视化展示。应用拓扑图主要是由圆圈、箭头连线、资源组成。每个箭头连线代表一个调用关系。连线上的数据表示请求量、平均RT和error数。拓扑使用平均RT进行量化,使用不同颜色对不同区间RT值进行标识,方便用户快速发现问题,并进行定位。 数据库:当数据库调用时间 ≥100ms时会被标记为黄色,当数据库调用时间≥200ms时会被标记为红色。 缓存:当缓存调用时间 ≥10ms时会被标记为黄色,当缓存调用时间≥30ms时会被标记为红色。 其他接口调用:当其他接口调用时间 ≥500ms时会被标记为黄色,当其他接口调用时间≥1000ms时会被标记为红色。 当出现error数大于0时会被标记为红色。 图1 应用拓扑
  • JAVA方法 介绍APM采集的JAVA方法指标的类别、名称、含义等信息。 表1 JAVA方法采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 拦截方法配置 obj_array JAVA - 2.0.0 - 配置拦截方法名,该方法会添加监控;拦截方法名多个用逗号分隔,拦截方法名为空,默认拦截所有public方法。 表2 JAVA方法指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 JAVA方法(method,根据配置的java方法名,统计方法调用详情。) class 类名 类名 - ENUM LAST method 方法 方法名 - ENUM LAST concurrentMax 最大并发 该方法的最大并发 - INT MAX errorCount 错误数 该方法的错误数 - INT SUM invokeCount 调用次数 该方法的调用次数 - INT SUM lastError 错误信息 该方法的错误信息 - STRING LAST maxTime 最大响应时间 该方法的最大响应时间 ms INT MAX range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM runningCount 正在执行数量 该方法采集时间点正在执行数量 - INT SUM totalTime 总响应时间 该方法的总响应时间 ms INT SUM 父主题: 基础监控
  • Netty内存 介绍APM采集的Netty内存指标的类别、名称、含义等信息。 表1 Netty内存指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 内存(memory,内存指标。) directMemoryUsage 已使用直接内存 已使用直接内存 - INT AVG maxDirectMemory 最大直接内存 最大直接内存 - INT MAX 异常(exception ,异常。) causeType 类名 类名 - ENUM LAST exceptionType 异常类型 异常类型 - ENUM LAST count 次数 次数 - INT SUM message 异常消息 异常消息 - STRING LAST stackTrace 异常堆栈 异常堆栈 - CLOB LAST 父主题: 基础监控
  • 线程 介绍APM采集的线程指标的类别、名称、含义等信息。 表1 线程采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 线程详情最大行数 integer JAVA 1 2.3.19 - 线程详情最大行数50。 表2 线程指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 线程详情(threadDetail,线程详情。) threadName 线程名 线程名 - ENUM LAST memory 内存 内存 - INT SUM stack 线程堆栈 线程堆栈 - CLOB LAST ids 线程id 线程id - STRING LAST cpuTime 线程cpu耗时 线程cpu耗时 ms INT SUM count 线程数 线程数 - INT LAST 父主题: 基础监控
  • JVM监控 介绍APM采集的JVM监控指标的类别、名称、含义等信息。 表1 JVM监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 调用链堆栈采集阈值 integer JAVA 0 2.0.4 - 请求时延超过阈值时自动打印堆栈。 表2 JVM监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 类加载(classLoading,JVM类加载数量的统计信息。) loadedClassCount 已加载类数量 类加载器已加载类数量 - INT SUM totalLoadedClassCount 总加载类数量 类加载器总加载类数量 - INT SUM unloadedClassCount 卸载类数量 类加载器卸载类数量 - INT SUM 编译(compile,JVM的类编译时间的统计数据。) compilationTime 编译时间 采集周期内 编译时间 ms INT SUM totalCompilationTime 总编译时间 总编译时间 ms INT SUM CPU(CPU监控,JVM进程的cpu利用率数据统计。) cpuRatio cpu利用率 java进程的cpu利用率 % DOUBLE AVG cpuRatioMax 最大cpu利用率 java进程的最大cpu利用率 % DOUBLE MAX cpuTimeInterval cpu使用时间 java进程在采集间隔内cpu使用的时间 ns INT SUM processorCount 处理器个数 处理器个数 - INT SUM systemTimeInterval 采集间隔 采集间隔时间 ns INT SUM totalCpuTime 总cpu时间 cpu使用总时间 ns INT SUM 内存(memory,JVM内存数据统计。) directMemoryUsage 直接内存 直接内存使用大小 M INT AVG directMemoryCapacity 直接内存最大值 直接内存总容量 M INT AVG heapMemoryUsage 堆内存 堆内存使用的大小 M INT AVG nonHeapMemoryUsage 非堆内存 非堆内存的使用大小 M INT AVG objectPendingFinalizationCount 正在回收数量 采集时间点正在回收的对象个数 - INT SUM 内存池(memoryPool ,JVM内存池数据,以内存池名称为维度统计。) committed 可使用内存 当前可使用的内存大小 Byte INT SUM init 初始化内存 初始化内存大小 Byte INT SUM max 最大内存 最大内存大小 Byte INT SUM name 内存池名称 内存池名称 - ENUM LAST used 已使用内存 已经被使用的内存大小 Byte INT SUM 线程(thread,JVM线程数统计。) currentThreadCpuTime 线程cpu时间 当前线程的cpu时间 - INT SUM currentThreadUserTime 线程用户时间 当前线程的用户时间 - INT SUM daemonThreadCount 守护线程数 守护线程数 - INT SUM deadlockedThreadsCount 死锁线程数 死锁线程数 - INT SUM monitorDeadlockedThreads 当前死锁线程 当前死锁线程id列表 - INT SUM peakThreadCount 峰值线程数 峰值线程数 - INT SUM threadCount 当前线程数 当前线程数 - INT SUM totalStartedThreadCount 总线程数 从java进程启动开始,累积启动的线程数 - INT SUM newThreadCount 初始状态线程数量 初始状态线程数量 - INT SUM runnableThreadCount 运行状态线程数量 运行状态线程数量 - INT SUM blockedThreadCount 阻塞状态线程数量 阻塞状态线程数量 - INT SUM waitingThreadCount 等待状态线程数量 等待状态线程数量 - INT SUM timedWaitingThreadCount 超时等待状态线程数量 超时等待状态线程数量 - INT SUM terminatedThreadCount 终止状态线程数量 终止状态线程数量 - INT SUM 父主题: 基础监控
  • C3P0连接池监控 介绍APM采集的C3P0连接池监控指标的类别、名称、含义等信息。 表1 C3P0连接池监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 获取连接调用链上报时间阈值(ms) integer JAVA 1 2.1.3 - getConnection方法调用链上报阈值,不超过该阈值不上报。 getConnection时是否获取池内信息 radio JAVA false 2.1.3 - getConnection时是否获取池内信息。 表2 C3P0连接池监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 数据源(dataSource,数据源。) url url url - ENUM LAST driverClass 驱动 驱动 - STRING LAST initialPoolSize 初始化连接数 初始化连接数 - INT LAST minPoolSize 连接池大小下限 连接池大小下限 - INT LAST maxPoolSize 连接池大小上限 连接池大小上限 - INT LAST numIdleConnections 空闲连接数 空闲连接数 - INT LAST numBusyConnections 活跃连接数 活跃连接数 - INT LAST numConnections 获取连接总数 获取连接总数 - INT LAST maxIdleTime 连接最大空闲时间 连接最大空闲时间 - INT LAST idleConnectionTestPeriod 空闲连接检查周期 空闲连接检查周期 - INT LAST testConnectionOnCheckout 检出连接有效性校验 检出连接有效性校验 - STRING LAST testConnectionOnCheckin 检入连接有效性校验 检入连接有效性校验 - STRING LAST acquireRetryAttempts 获取连接重试次数 获取连接重试次数 - INT LAST acquireRetryDelay 获取连接重试间隔 获取连接重试间隔 - INT LAST acquireIncrement 无连接可用时创建连接数 无连接可用时创建连接数 - INT LAST 获取连接详情(connection,获取连接详情。) url 连接地址 连接地址 - ENUM LAST invokeCount 调用次数 调用次数 - INT LAST totalTime 总时间 总时间 - INT LAST errorCount 错误次数 错误次数 - INT SUM maxTime 最慢调用 最慢调用 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM concurrentMax 最大并发 最大并发 - INT MAX 版本(version,版本。) version 版本 版本 - STRING LAST 异常(exception,C3P0调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST 父主题: 数据库
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全