云数据库 GaussDB-监控指标:支持的监控指标

时间:2023-11-01 16:19:21

支持的监控指标

GaussDB数据库性能监控指标,如下表所示。

表1 GaussDB支持的监控指标

指标ID

指标名称

指标含义

展示对象

测量对象

监控周期(原始指标)

rds001_cpu_util

CPU使用率

该指标用于统计测量对象的CPU使用率。

当前节点

节点

60秒

rds002_mem_util

内存使用率

该指标用于统计测量对象的内存使用率。

当前节点

节点

60秒

rds003_bytes_in

数据写入量

该指标用于统计测量对象对应VM的网络发送字节数,取时间段的平均值

当前节点

节点

60秒

rds004_bytes_out

数据传出量

该指标用于统计测量对象对应VM的网络接受字节数,取时间段的平均值

当前节点

节点

60秒

rds014_iops

数据磁盘每秒读写次数

该指标用于统计测量对象的节点数据磁盘每秒读写次数,该值为实时值。

当前节点

节点

60秒

rds016_disk_write_throughput

数据磁盘写吞吐量

该指标用于统计测量对象的节点数据磁盘每秒写吞吐量,该值为实时值。

当前节点

节点

60秒

rds017_disk_read_throughput

数据磁盘读吞吐量

该指标用于统计测量对象的节点数据磁盘每秒读吞吐量,该值为实时值。

当前节点

节点

60秒

rds020_avg_disk_ms_per_write

数据磁盘单次写入花费的时间

该指标用于统计测量对象的节点数据磁盘单次写入花费的时间,取时间段的平均值。

当前节点

节点

60秒

rds021_avg_disk_ms_per_read

数据磁盘单次读取花费的时间

该指标用于统计测量对象的节点数据磁盘单次读取花费的时间,取时间段的平均值。

当前节点

节点

60秒

io_bandwidth_usage

磁盘io带宽占用率

当前磁盘io带宽与磁盘最大带宽比值

当前节点

节点

60秒

iops_usage

IOPS使用率

当前iops与磁盘最大iops比值

当前节点

节点

60秒

rds005_instance_disk_used_size

实例数据磁盘已使用大小

该指标用于统计测量对象的实例数据磁盘已使用大小,该值为实时值。

实例

实例

60秒

rds006_instance_disk_total_size

实例数据磁盘总大小

该指标用于统计测量对象的实例数据磁盘总大小,该值为实时值。

实例

实例

60秒

rds007_instance_disk_usage

实例数据磁盘已使用百分比

该指标用于统计测量对象的实例数据磁盘使用率,该值为实时值。

实例

实例

60秒

rds035_buffer_hit_ratio

buffer命中率

该指标用于统计数据库buffer命中率。

实例

实例

60秒

rds036_deadlocks

死锁次数

该指标用于统计数据库发生事务死锁的次数,取该时间段的增量值。

实例

实例

60秒

rds048_P80

80% SQL的响应时间

该指标用于统计数据库80% SQL的响应时间,该值为实时值。

实例

实例

60秒

rds049_P95

95% SQL的响应时间

该指标用于统计数据库95% SQL的响应时间,该值为实时值。

实例

实例

60秒

rds008_disk_used_size

磁盘已使用大小

该指标用于统计测量对象的节点数据磁盘使用值,该值为实时值。

当前节点

组件

60秒

rds009_disk_total_size

磁盘总大小

该指标用于统计测量对象的节点数据磁盘总大小,该值为实时值。

当前节点

组件

60秒

rds010_disk_usage

磁盘已使用百分比

该指标用于统计测量对象的节点数据磁盘使用率,该值为实时值。

当前节点

组件

60秒

rds024_current_sleep_time

主机流控时间

该指标用于统计测量对象的主机流控时间,该值为实时值。

分布式:备DN

集中式:备DN

组件

60秒

rds025_current_rto

备机RTO时间

该指标用于统计测量对象的主备复制的RTO,该值为实时值。

分布式:备DN

集中式:备DN

组件

60秒

rds026_login_counter

用户登入次数/秒

该指标用于统计每秒的登入次数,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds027_logout_counter

用户登出次数/秒

该指标用于统计每秒的登出次数,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds028_standby_delay

备机redo进度

该指标用于统计分片内备机redo进度,表示备机和主机的差距,该值为实时值。

分布式:备DN

集中式:主DN

组件

60秒

rds030_wait_ratio

锁等待状态会话比率

该指标用于统计当前处于锁等待状态会话占活跃工作状态下会话比率,该值为实时值。

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds031_active_ratio

活跃会话率

该指标用于统计当前处于活跃工作状态会话占总会话数比率,该值为实时值。

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds034_inuse_counter

CN连接数

该指标用于统计CN连接池中正在使用的连接数,该值为实时值。

分布式:所有CN

集中式:不采集

组件

60秒

rds037_commit_counter

用户提交事务数/秒

该指标用于统计用户每秒提交的事务数,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds038_rollback_counter

用户回滚事务数/秒

该指标用于统计用户每秒回滚的事务数,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds039_bg_commit_counter

后台提交事务数/秒

该指标用于统计后台每秒提交的事务数,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds040_bg_rollback_counter

后台回滚事务数/秒

该指标用于统计后台每秒回滚的事务数,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds041_resp_avg

用户事务平均响应时间

该指标用于统计用户事务的平均响应时间。

分布式:所有CN

集中式:主DN

组件

60秒

rds042_rollback_ratio

用户事务回滚率

该指标用于统计用户事务回滚事务占用户提交、回滚事务之和的比率,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds043_bg_rollback_ratio

后台事务回滚率

该指标用于统计后台事务回滚事务占用户提交、回滚事务之和的比率,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds044_ddl_count

Data Definition Language

该指标用于统计用户负载在query层的DDL数量,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds045_dml_count

Data Manipulation Language

该指标用于统计用户负载在query层的DML数量,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds046_dcl_count

Data Control Language

该指标用于统计用户负载在query层的DCL数量,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds047_ddl_dcl_ratio

DDL+DCL比率

该指标用于统计用户负载在query层的DDL+DCL占DDL+DCL+DML的比率,取时间段的平均值。

分布式:所有CN

集中式:主DN

组件

60秒

rds050_ckpt_delay

待落盘的数据量

该指标用于统计信息同步到磁盘过程中待落盘的数据量,该值为实时值。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds051_phyrds

读物理文件的IO次数/秒

该指标用于统计数据库每秒读物理物件的IO次数,取时间段的平均值。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds052_phywrts

写物理文件的IO次数/秒

该指标用于统计数据库每秒写物理物件的IO次数,取时间段的平均值。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds053_online_session

在线会话数量

该指标用于统计当前在线的session个数,该值为实时值。

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds054_active_session

活跃会话数量

该指标用于统计当前所有活跃工作状态下会话个数,该值为实时值。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds055_online_ratio

在线会话率

该指标用于统计CN(分布式)/主DN(主备版)上的在线会话比例,该值为实时值

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds060_long_running_transaction_exectime

数据库最长事务的执行时长

该指标用于统计测量对象的数据库最长事务的执行时长, 该值为实时值。

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds066_replication_slot_wal_log_size

复制槽保留的WAL日志大小

该指标用于统计主DN上复制槽中保留的WAL日志的大小, 该值为实时值。

分布式:主DN

集中式:主DN

组件

60秒

rds067_xlog_lsn

xlog速率

该指标用于统计CN或者主DN上xlog的速率, 该值为实时值。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds068_swap_used_ratio

交换内存使用率

该指标用于描述操作系统交换内存使用率,该值为实时值。

当前节点

节点

60秒

rds069_swap_total_size

交换内存总大小

该指标用于描述操作系统交换内存总大小,该值为实时值。

当前节点

节点

60秒

rds070_thread_pool

线程池使用率

该指标用于统计CN和DN的线程池使用率,该值为实时值。

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds071_locks_session

等锁会话数

该指标用于统计CN/主DN的等锁会话数,该值为实时值。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds072_streaming_dr_xlog_gap

灾备集群分片日志差距

该指标用于统计流式容灾特性开启情况下,灾备集群中各个分片相对于生产集群的日志差距。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds073_streaming_dr_xlog_to_be_replayed

灾备集群分片待回放日志量

该指标用于统计流式容灾特性开启情况下,灾备集群中各个分片待回放日志量。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds074_streaming_dr_xlog_flushing_rate

灾备集群分片日志落盘速率

该指标用于统计流式容灾特性开启情况下,灾备集群中各个分片日志落盘速率。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds075_streaming_dr_xlog_replay_rate

灾备集群分片日志回放速率

该指标用于统计流式容灾特性开启情况下,灾备集群中各个分片日志回放速率。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds076_streaming_dr_rpo

分片RPO

该指标用于统计流式容灾特性开启情况下,各个分片的实时RPO。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds077_streaming_dr_rto

分片RTO

该指标用于统计流式容灾特性开启情况下,各个分片的实时RTO。

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds078_inactive_replication_slot

非活跃的复制槽数

该指标用于统计非活跃的复制槽数(物理加逻辑)。

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds079_standy_not_replayed_log

只读节点未回放日志量

该指标用于查询只读节点日志回放与接收量差距。

分布式:备DN

集中式:备DN

组件

60秒

cpu_user_usage

用户态CPU时间占比

该指标用于统计用户态CPU时间占比。

当前节点

节点

60秒

cpu_sys_usage

内核态CPU时间占比

该指标用于统计内核态CPU时间占比。

当前节点

节点

60秒

cpu_wait_usage

硬盘IO等待时间占比

该指标用于统计硬盘IO等待时间占比。

当前节点

节点

60秒

rds080_xlog_num

xlog数量

该指标用于统计CN和DN数据目录下xlog数量,该值为实时值

分布式:所有CN+所有DN

集中式:所有DN

组件

60秒

rds081_xlog_size

xlog大小

该指标用于统计CN和DN数据目录下xlog大小,该值为实时值

分布式:所有CN+所有DN

集中式:所有DN

组件

60秒

rds064_dynamic_used_memory

已使用动态内存

该指标用于统计测量对象的动态内存已使用大小,该值为实时值

分布式:所有CN+主DN

集中式:主DN

组件

60秒

rds065_dynamic_used_memory_usage

动态内存使用率

该指标用于统计测量对象的动态内存使用率,该值为实时值

分布式:所有CN+主DN

集中式:所有DN

组件

60秒

rds061_idle_in_transaction_num

空闲事务个数

该指标用于统计测量对象的空闲事务连接的数量,该值为实时值

分布式:所有CN

集中式:主DN

组件

60秒

rds062_slowquery_sys

系统库慢SQL数量

该指标用于统计指定周期内主DN/CN上系统数据库慢SQL数量,该值为实时值

分布式:所有CN

集中式:主DN

组件

60秒

rds063_slowquery_user

用户库慢SQL数量

该指标用于统计指定周期内主DN/CN上用户库慢SQL数量,该值为实时值

分布式:所有CN

集中式:主DN

组件

60秒

support.huaweicloud.com/usermanual-opengauss/opengauss_01_0071.html