-
监控指标 表1 监控指标说明 指标ID 指标名称 指标含义 取值范围 单位 进制 测量对象(维度) 监控周期(原始指标) throttled_calls API被流控的调用次数 该指标表示API被流控之后累计的调用次数 ≥0 Times/min 不涉及 专享版API网关实例(instance_id) 1分钟 requests 接口调用次数 该指标表示API调用次数 ≥0 Times/min 不涉及 专享版API网关实例(instance_id) 1分钟 req_count_error 异常次数 该指标表示API总的错误次数 ≥0 Times/min 不涉及 单个API(instance_id,api_id) 1分钟 req_count_5xx 5xx调用次数 该指标表示API的5xx调用次数 ≥0 Times/min 不涉及 单个API(instance_id,api_id) 1分钟 req_count_4xx 4xx调用次数 该指标表示API的4xx调用次数 ≥0 Times/min 不涉及 单个API(instance_id,api_id) 1分钟 req_count_2xx 2xx调用次数 该指标表示API的2xx调用次数 ≥0 Times/min 不涉及 单个API(instance_id,api_id) 1分钟 req_count 接口调用次数 该指标表示API调用次数 ≥0 Times/min 不涉及 单个API(instance_id,api_id) 1分钟 output_throughput 流出流量 该指标表示API的流出流量 ≥0 Byte 1000(SI) 单个API(instance_id,api_id) 1分钟 max_latency 最大延迟毫秒数 该指标表示API的最大延迟毫秒数 ≥0 ms 不涉及 专享版API网关实例(instance_id) 1分钟 max_latency 最大延迟毫秒数 该指标表示API的最大延迟毫秒数 ≥0 ms 不涉及 单个API(instance_id,api_id) 1分钟 input_throughput 流入流量 该指标表示API的流入流量 ≥0 Byte 1000(SI) 单个API(instance_id,api_id) 1分钟 error_5xx 5xx调用次数 该指标表示API的5xx调用次数 ≥0 Times/min 不涉及 专享版API网关实例(instance_id) 1分钟 error_4xx 4xx调用次数 该指标表示API的4xx调用次数 ≥0 Times/min 不涉及 专享版API网关实例(instance_id) 1分钟 avg_latency 平均延迟毫秒数 该指标表示API的平均延迟毫秒数 ≥0 ms 不涉及 专享版API网关实例(instance_id) 1分钟 avg_latency 平均延迟毫秒数 该指标表示API的平均延迟毫秒数 ≥0 ms 不涉及 单个API(instance_id,api_id) 1分钟 node_system_load 网关节点系统负载 该指标用于统计当前数据面网关节点负载详情,1表示低水位,2表示中水位,3表示高水位 1,2,3, count 不涉及 单个网关节点(node_ip) 1分钟 node_cpu_usage 网关节点cpu使用率 该指标用于统计当前数据面网关节点cpu使用率 ≥0 % 不涉及 单个网关节点(node_ip) 1分钟 node_memory_usage 网关节点内存使用率 该指标用于统计当前数据面网关节点内存使用率 ≥0 % 不涉及 单个网关节点(node_ip) 1分钟
-
Smart Connect监控指标 仅集群实例支持Smart Connect监控指标。 表5 Smart Connect支持的监控指标 指标ID 指标名称 指标含义 取值范围 单位 进制 测量对象(维度) 监控周期(原始指标) kafka_wait_synchronize_data 待同步Kafka数据量 Kafka任务的待同步数据量。 ≥ 0 Count 不涉及 Kafka实例的Smart Connect任务 1分钟 kafka_synchronize_rate Kafka每分钟同步数据量 Kafka任务每分钟同步的数据量。 ≥ 0 Count 不涉及 Kafka实例的Smart Connect任务 1分钟 task_status 任务状态 当前任务状态。 0:任务异常 1:任务正常 不涉及 不涉及 Kafka实例的Smart Connect任务 1分钟 message_delay 消息时延 消息到达源端的时间与到达目标端的时间之差。 ≥ 0 ms 不涉及 Kafka实例的Smart Connect任务 1分钟 使用Smart Connect监控指标时,请注意如下几点: Kafka双向数据复制的Smart Connect任务在监控中会被拆分为2个任务,分别为“Smart Connect任务名_source_0”和“Smart Connect任务名_source_1”。 如果Topic中的消息在进行下一次数据同步前,已经全部老化,此时实际是没有待同步的Kafka数据,但是Kafka数据同步监控指标使用的是包含老化数据的offset值,“待同步Kafka数据量”会显示老化的消息数。
-
维度 Key Value kafka_instance_id Kafka实例 kafka_broker Kafka实例节点 kafka_topics Kafka实例主题 kafka_partitions Kafka实例分区 kafka_groups-partitions Kafka实例分区的消费组 kafka_groups_topics Kafka实例队列的消费组 kafka_groups Kafka实例的消费组 connector_task Kafka实例的Smart Connect任务
-
主题监控指标 表3 主题支持的监控指标 指标ID 指标名称 指标含义 取值范围 单位 进制 测量对象(维度) 监控周期(原始指标) topic_bytes_in_rate 生产流量 该指标用于统计每秒生产的字节数。 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~500000000 Byte/s 1024(IEC) Kafka实例队列 1分钟 topic_bytes_out_rate 消费流量 该指标用于统计每秒消费的字节数。 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~500000000 Byte/s 1024(IEC) Kafka实例队列 1分钟 topic_data_size 队列数据容量 该指标用于统计队列当前的消息数据大小。 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~5000000000000 Byte 1024(IEC) Kafka实例队列 1分钟 topic_messages 队列消息总数 该指标用于统计队列当前的消息总数。 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 ≥ 0 Count 不涉及 Kafka实例队列 1分钟 topic_messages_in_rate 消息生产速率 该指标用于统计每秒生产的消息数量。 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~500000 Count/s 不涉及 Kafka实例队列 1分钟 partition_messages 分区消息数 该指标用于统计分区中当前的消息个数。 在“主题”页签,当“监控类型”为“分区监控”时,才包含该指标。 ≥ 0 Count 不涉及 Kafka实例队列 1分钟 produced_messages 生产消息数 该指标用于统计目前生产的消息总数。 在“主题”页签,当“监控类型”为“分区监控”时,才包含该指标。 ≥ 0 Count 不涉及 Kafka实例队列 1分钟
-
实例监控指标 表1 实例支持的监控指标 指标ID 指标名称 指标含义 取值范围 单位 进制 测量对象(维度) 监控周期(原始指标) current_partitions 分区数 该指标用于统计Kafka实例中已经使用的分区数量。 0~100000 Count 不涉及 Kafka实例 1分钟 current_topics 主题数 该指标用于统计Kafka实例中已经创建的主题数量。 0~100000 Count 不涉及 Kafka实例 1分钟 group_msgs 消息堆积数 该指标用于统计Kafka实例中所有消费组中总堆积消息数。 0~1000000000 Count 不涉及 Kafka实例 1分钟 instance_bytes_in_rate 生产流量 统计实例中每秒生产的字节数。 部分存量实例不支持此监控,具体以控制台为准。 0~1000000 Byte/s 1024(IEC) Kafka实例 1分钟 instance_bytes_out_rate 消费流量 统计实例中每秒消费的字节数。 部分存量实例不支持此监控,具体以控制台为准。 0~1000000 Byte/s 1024(IEC) Kafka实例 1分钟 current_partitions_usage 分区使用率 该指标用于统计分区使用率。 部分存量实例不支持此监控,具体以控制台为准。 0~100 % 不涉及 Kafka实例 1分钟
-
消费组监控指标 表4 消费组支持的监控指标 指标ID 指标名称 指标含义 取值范围 单位 进制 测量对象(维度) 监控周期(原始指标) messages_consumed 分区已消费消息数 该指标用于统计当前消费组已经消费的消息个数。 在“消费组”页签,“主题”为指定的Topic名称,“监控类型”为“分区监控”时,才包含该指标。 ≥ 0 Count 不涉及 Kafka实例的消费组 1分钟 messages_remained 分区可消费消息数 该指标用于统计消费组可消费的消息个数。 在“消费组”页签,“主题”为指定的Topic名称,“监控类型”为“分区监控”时,才包含该指标。 ≥ 0 Count 不涉及 Kafka实例的消费组 1分钟 topic_messages_remained 队列可消费消息数 该指标用于统计消费组指定队列可以消费的消息个数。 在“消费组”页签,“主题”为指定的Topic名称,“监控类型”为“基本监控”时,才包含该指标。 0~(263-1) Count 不涉及 Kafka实例的消费组 1分钟 topic_messages_consumed 队列已消费消息数 该指标用于统计消费组指定队列当前已经消费的消息数。 在“消费组”页签,“主题”为指定的Topic名称,“监控类型”为“基本监控”时,才包含该指标。 0~(263-1) Count 不涉及 Kafka实例的消费组 1分钟 consumer_messages_remained 消息堆积数(消费组可消费消息数) 该指标用于统计消费组剩余可以消费的消息个数。 在“消费组”页签,“主题”为“全部队列”时,才包含该指标。 0~(263-1) Count 不涉及 Kafka实例的消费组 1分钟 consumer_messages_consumed 消费组已消费消息数 该指标用于统计消费组当前已经消费的消息数。 在“消费组”页签,“主题”为“全部队列”时,才包含该指标。 0~(263-1) Count 不涉及 Kafka实例的消费组 1分钟 messages_consumed_per_min 分区消费速率 统计消费组指定队列分区每分钟的消费数。 在“消费组”页签,“主题”为指定的Topic名称,“监控类型”为“分区监控”时,才包含该指标。 部分存量实例不支持此监控,具体以控制台为准。 0~30000000 Count/min 不涉及 Kafka实例的消费组 1分钟 topic_messages_consumed_per_min 队列消费速率 统计消费组指定队列每分钟的消费数。 在“消费组”页签,“主题”为指定的Topic名称,“监控类型”为“基本监控”时,才包含该指标。 部分存量实例不支持此监控,具体以控制台为准。 0~30000000 Count/min 不涉及 Kafka实例的消费组 1分钟 consumer_messages_consumed_per_min 消费组消费速率 统计消费组每分钟的消费数。 在“消费组”页签,“主题”为“全部Topic”时,才包含该指标。 部分存量实例不支持此监控,具体以控制台为准。 0~30000000 Count/min 不涉及 Kafka实例的消费组 1分钟
-
维度 Key Value rabbitmq_instance_id RabbitMQ实例 rabbitmq_node RabbitMQ实例节点 rabbitmq_queue RabbitMQ实例队列 rabbitmq_vhost RabbitMQ实例Vhost rabbitmq_vhost_exchange RabbitMQ实例Exchange rabbitmq_vhost_queue RabbitMQ实例Queue
-
维度 Key Value reliablemq_instance_id RocketMQ实例 reliablemq_broker RocketMQ实例节点 reliablemq_topics RocketMQ实例队列 reliablemq_groups RocketMQ实例的消费组 reliablemq_groups_topics RocketMQ实例队列的消费组 reliablemq_dlq_topics RocketMQ实例的死信队列
-
监控指标 如下监控指标需要在实例节点查看,具体方法请参见查看监控指标。 表1 GeminiDB Mongo支持的监控指标 指标ID 指标名称 指标含义 取值范围 单位 进制 测量对象 监控周期(原始指标) nosql001_cpu_usage CPU利用率 该指标为从系统层面采集的CPU使用率。 0~100 % 不涉及 GeminiDB Mongo实例的节点 1分钟 nosql002_mem_usage 内存利用率 该指标为从系统层面采集的内存使用率。 0~100 % 不涉及 GeminiDB Mongo实例的节点 1分钟 nosql003_bytes_out 网络输出吞吐量 统计平均每秒从测量对象的所有网络适配器输出的流量。 ≥ 0 bytes/s 1024(IEC) GeminiDB Mongo实例的节点 1分钟 nosql004_bytes_in 网络输入吞吐量 统计平均每秒从测量对象的所有网络适配器输入的流量。 ≥ 0 bytes/s 1024(IEC) GeminiDB Mongo实例的节点 1分钟 nosql005_disk_usage 存储容量使用率 该指标为存储容量使用率。 0~100 % 不涉及 GeminiDB Mongo实例 1分钟 nosql006_disk_total_size 存储容量总容量 该指标为实例的存储容量总容量。 ≥ 0 GB 不涉及 GeminiDB Mongo实例 1分钟 nosql007_disk_used_size 存储容量使用量 该指标为实例的存储容量使用量。 ≥ 0 GB 不涉及 GeminiDB Mongo实例 1分钟 mongodb001_command_ps command执行频率 该指标用于统计平均每秒command语句在节点上执行次数。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb002_delete_ps delete语句执行频率 该指标用于统计平均每秒delete语句在节点上执行次数。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb003_insert_ps insert语句执行频率 该指标用于统计平均每秒insert语句在节点上执行次数。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb004_query_ps query语句执行频率 该指标用于统计平均每秒query语句在节点上执行次数。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb005_update_ps update语句执行频率 该指标用于统计平均每秒update语句执行次数。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb006_getmore_ps getmore语句执行频率 该指标用于统计平均每秒getmore语句在节点上执行次数。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb007_connections 当前活动连接数 该指标用于统计试图连接到实例节点的连接数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb007_connections_usage 当前活动连接数百分比 该指标用于统计试图连接到实例节点的连接数占可用连接数百分比。 0~100 % 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb008_mem_resident 驻留内存 该指标用于统计当前驻留内存的大小。 ≥ 0 MB 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb009_mem_virtual 虚拟内存 该指标用于统计当前虚拟内存的大小。 ≥ 0 MB 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb010_regular_asserts_ps 常规断言频率 该指标用于统计常规断言频率。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb011_warning_asserts_ps 警告频率 该指标用于统计警告频率。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb012_msg_asserts_ps 消息断言频率 该指标用于统计消息断言频率。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb013_user_asserts_ps 用户断言频率 该指标用于统计用户断言频率。 ≥ 0 Count/s 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb014_queues_total 等待锁的操作数 该指标用于统计当前等待锁的操作数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb015_queues_readers 等待读锁的操作数 该指标用于统计当前等待读锁的操作数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb016_queues_writers 等待写锁的操作数 该指标用于统计当前等待写锁的操作数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb017_page_faults 缺页错误数 该指标用于统计当前节点上的缺页错误数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb018_porfling_num 慢查询数 该指标用于统计当前节点上的慢查询数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb019_cursors_open 当前维护游标数 该指标用于统计当前节点上的维护游标数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟 mongodb020_cursors_timeout 服务超时游标数 该指标用于统计当前节点上的服务超时游标数。 ≥ 0 Count 不涉及 GeminiDB Mongo实例的节点 1分钟
-
功能说明 本节定义了D
CS 服务上报
云监控服务 的监控指标的命名空间,监控指标列表和维度定义,用户可以通过
云监控 服务提供管理控制台或API接口来检索DCS服务产生的监控指标和告警信息。 实例监控指标差异如下: 表1 实例监控指标差异 实例类型 实例级监控 数据节点级监控 Proxy节点级监控 单机 支持 只有实例级别的监控指标,实例监控即为数据节点监控。 不涉及 不涉及 主备 支持 实例监控是指对主节点的监控。 支持 数据节点监控分别是对主节点和备节点的监控。 不涉及 读写分离 支持 实例监控是指对主节点的监控。 支持 数据节点监控分别是对主节点和备节点的监控。 支持 Proxy节点监控是对实例中每个Proxy节点的监控。 Proxy集群 支持 实例监控是对集群所有主节点数据汇总后的监控。 支持 数据节点监控是对集群每个分片的监控。 支持 Proxy节点监控是对集群每个Proxy节点的监控。 Cluster集群 支持 实例监控是对集群所有主节点数据汇总后的监控。 支持 数据节点监控是对集群每个分片的监控。 不涉及
-
监控指标 表1 KVS支持的监控指标 指标ID 指标名称 指标含义 取值范围 单位 进制 测量对象 监控周期(原始指标) store_kv_request_count 总接口请求数 该指标用于统计当前统计周期的请求总数。 ≥ 0 Count 不涉及 仓 1分钟 store_request_count_monitor_2XX 2xx状态码个数 该指标用于统计响应状态码为2XX的请求数。 ≥ 0 Count 不涉及 仓 1分钟 store_request_count_monitor_4XX 4xx状态码个数 该指标用于统计响应状态码为4xx的请求数。 ≥ 0 Count 不涉及 仓 1分钟 store_request_count_monitor_5XX 5xx状态码个数 该指标用于统计响应状态码为5xx状态码个数。 ≥ 0 Count 不涉及 仓 1分钟 store_kv_request_latency_ave 请求平均时延 该指标用于统计周期内从系统收到完整请求到结束返回响应的耗时平均值。 ≥ 0 ms 不涉及 仓 1分钟 store_read_traffic 读流量 该指标用于统计当前统计周期内读取类请求文档大小总和。 ≥ 0 Byte 1024(IEC) 仓 1分钟 store_write_traffic 写流量 该指标用于统计当前统计周期内写入类请求文档大小总和。 ≥ 0 Byte 1024(IEC) 仓 1分钟
-
维度 Key Value dcs_instance_id Redis实例 dcs_cluster_redis_node 数据节点 dcs_cluster_proxy_node Redis 3.0 Proxy集群实例Proxy节点 dcs_cluster_proxy2_node Redis 4.0及以上版本Proxy集群和读写分离实例Proxy节点 dcs_memcached_instance_id Memcached实例
-
监控指标 如下监控指标需要在实例节点查看,具体方法请参见查看GeminiDB Influx监控指标。 表1 GeminiDB Influx支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) gemini001_cpu_usage CPU利用率 该指标为从系统层面采集的CPU使用率。 单位:% 0~100 % GeminiDB Influx实例的节点 1分钟 gemini002_mem_usage 内存利用率 该指标为从系统层面采集的内存使用率。 单位:% 0~100 % GeminiDB Influx实例的节点 1分钟 gemini003_bytes_out 网络输出吞吐量 统计平均每秒从测量对象的所有网络适配器输出的流量。 单位:kb/s ≥ 0 kb/s GeminiDB Influx实例的节点 1分钟 gemini004_bytes_in 网络输入吞吐量 统计平均每秒从测量对象的所有网络适配器输入的流量。 单位:kb/s ≥ 0 kb/s GeminiDB Influx实例的节点 1分钟 nosql005_disk_usage 存储容量使用率 该指标为存储容量使用率。 单位:% 0~100 % GeminiDB Influx实例 1分钟 nosql006_disk_total_size 存储容量总容量 该指标为实例的存储容量总容量。 单位:GB ≥ 0 GB GeminiDB Influx实例 1分钟 nosql007_disk_used_size 存储容量使用量 该指标为实例的存储容量使用量。 单位:GB ≥ 0 GB GeminiDB Influx实例 1分钟 influxdb001_series_num 时间线数量 描述总的时间线数量。 单位:Counts ≥ 0 Counts GeminiDB Influx实例的节点 1分钟 influxdb002_query_req_ps 每秒查询请求 描述每秒查询请求的数量。 单位:Counts/s ≥ 0 Counts/s GeminiDB Influx实例的节点 1分钟 influxdb003_write_req_ps 每秒写入请求 描述每秒写入请求的数量。 单位:Counts/s ≥ 0 Counts/s GeminiDB Influx实例的节点 1分钟 influxdb004_write_points_ps 写入数据点 描述每秒写入的数据点数量。 单位:Counts/s ≥ 0 Counts/s GeminiDB Influx实例的节点 1分钟 influxdb005_write_concurrency 写入并发量 描述并发写入的请求数量。 单位:Counts ≥ 0 Counts GeminiDB Influx实例的节点 1分钟 influxdb006_query_concurrency 查询并发量 描述并发查询的请求数量。 单位:Counts ≥ 0 Counts GeminiDB Influx实例的节点 1分钟