云服务器内容精选

  • 慢日志存储 开启收集慢日志开关后,会将SQL的文本内容存储到OBS中,以便进行分析。 已升级高级智能运维包,您可以在右上角日志管理,设置慢日志存储时长。 慢SQL存储:默认7天,可设置范围1~30天,到期后自动删除。 全量SQL存储:默认7天,可设置范围为1~180天。 日志数据量:免费赠送5GB的SQL存储空间,超出部分将按需计费。 图5 日志存储与归档(已升级高级智能运维包) 未升级高级智能运维包 慢SQL存储:默认1小时,到期后自动删除。 全量SQL存储:1小时 图6 日志存储与归档(未升级高级智能运维包)
  • 功能限制 最多可配置100条限流规则。 SQL限流功能当前仅支持SELECT、UPDATE、DELETE关键字,不支持INSERT关键字。 当SQL语句匹配多条限流规则时,优先生效最新添加的规则,之前的规则不再生效。 在添加SQL限流规则之前,已经开始执行的SQL语句,不会被记入并发数。 若复制时延过大,针对只读实例,新增或删除限流规则不会立刻生效。 系统表不受SQL限流的限制。 不涉及数据查询的SQL不受限流的限制,例如:select sleep(***); 暂不支持对存储过程、触发器、函数内的SQL做限流设置。 您可以在DAS执行如下SQL查看SQL限流规则的执行情况:select * from information_schema.rds_sql_filter_info; 当设置过多限流规则时,对性能有一定影响,使用后请删除多余的规则。
  • 使用场景 紧急恢复实例场景中,通过设置慢会话阈值帮助用户快速识别异常会话并手动结束该会话,使得数据库恢复正常,提高数据库的可用性。 新业务中出现并发数过高的SQL语句导致实例不稳定场景中,通过设置SQL限流规则功能控制并发数过高的SQL语句,保证实例的稳定性。 出现“磁盘空间满”问题时,通过查看磁盘空间功能实时了解磁盘空间概况与分布。您可以设置存储空间自动扩容,在实例存储空间达到阈值时,会触发自动扩容,详见存储空间自动扩容。 在突发流量过高、异常读写等业务场景中,通过配置自治限流功能控制活跃连接数来保障核心业务访问的可用性。
  • 功能列表 智能DBA支持以下功能,详情请参见表1。 表1 功能说明 功能 描述 相关文档 实例概览 提供数据库整体运行情况,包括告警统计、资源使用情况和重点性能指标,多方面实时展示实例的运行状态。基于运行数据结合智能算法对实例进行健康智能诊断,并对异常项提供解决方法与使用建议。 查看实例运行情况 实时会话 提供当前数据库会话快照查询,并支持排序过滤展示。可基于用户、访问主机、库等多维度快速过滤识别到自定义慢SQL会话、活跃会话等。KILL会话与SQL限流功能应对紧急实例恢复,保障数据库的可用性。 管理实时会话 实时性能 展示数据库实例各项关键指标,并提供日期对比功能,方便查看周期业务以及指标变化情况,及时发现异常。秒级监控有助于精准定位问题。 查看性能指标 容量预估 数据库实例在使用过程中,当前磁盘空间数据与日志的占比以及历史上涨情况往往是用户关心的重点。智能DBA助手提供了容量预估功能,可以方便地查看磁盘空间概况与分布,并通过历史数据结合智能算法提供了空间预估等功能,尽早发现空间不足的情况并及时避免。此外还提供了智能扩容、表智能诊断、TOP50库表协助运维功能。 管理磁盘容量 锁&事务 该模块从元数据锁以及InnoDB锁两个维度分析当前业务锁状态。通过元数据锁视图与InnoDB锁拓扑图管理阻塞事务,协助用户优化自身业务,减少锁冲突。 管理锁&事务 慢SQL 提供指定时间段内的慢SQL分析功能。从用户、IP、SQL模板等进行多维统计,展示统计结果并支持指定排序,识别慢SQL的精准来源,方便用户快速优化业务。 查看慢SQL 全量SQL 在实例开启全量SQL的前提下,该模块基于全量SQL数据进行分析,并提供多维度的分析、搜索、过滤的能力,帮助用户全面洞察SQL,TOP SQL快速定位异常原因,保障数据库稳定运行。 查看TOP SQL 新增SQL洞察任务 SQL限流 针对新上业务不能及时发包优化的SQL和突发流量导致CPU等资源100%瓶颈的场景,SQL限流功能通过控制既定SQL规则的并发度协助业务侧及时流控,保证核心业务的稳定运行。 设置SQL限流规则 自治限流 该功能自动检测数据库的CPU利用率、活跃会话数等异常,根据业务优先级进行限流处理,保证核心业务的稳定运行。 用户可以根据业务情况,按照数据库或者用户进行限流。将非核心数据库或非核心用户业务配置为限流对象,可以保障核心业务不受影响。 配置自治限流 诊断日报 对前一日实例状态的汇总展示,包括以上部分模块的重点指标:慢SQL分析、全量SQL分析、性能与磁盘分析。支持用户下载和订阅分析报告。建议每天定时对实例进行诊断,以保证实例上业务的正常运转。 管理诊断日报 异常快照 智能判断实例异常,记录会话快照、锁/事务等快照信息,方便后续问题定位。 管理异常快照
  • 功能描述 智能DBA(Database Administrator,数据库管理员)功能主要面向开发人员和数据库管理人员,提供数据库运维和智能诊断的可视化界面,提升数据库的运维能力与易用性。通过告警统计、资源使用情况、健康智能诊断、性能指标数据、容量预估等维度分析,帮助用户快速定位故障,实时了解实例运行情况。 如果要在RDS界面使用智能DBA助手功能,IAM子账号必须要有RDS FullAccess、DAS FullAccess、DAS Administrator、CES FullAccess权限。如果需要添加权限,请参见创建用户并授权使用RDS。
  • 常见问题 问题:近一天空间增长异常如何处理? 解决方法:设置诊断阈值后如果出现近一天空间增长异常,需要检查表空间碎片,及时回收碎片,尽量不使用DELEDTE清空数据。如有其他疑问请提交工单联系客服为您解答。 问题:无主键表对数据库的影响是什么? 解决方法:无主键表在数据库运行中会导致慢SQL,从而影响实例的稳定性。建议为无主键表添加主键,减少主从复制时延。 问题:无索引表对数据库的影响是什么? 解决方法:无索引表在数据库运行中会导致慢SQL,从而影响实例的稳定性。建议为表字段添加对应索引,提升查询效率。
  • 库表大小统计 可查看物理文件大小Top50库表,结合磁盘空间的分布情况,识别占用较高的库表并进行优化。 物理文件大小为精确采集数据,其余指标为预估值(存在误差),如差距较大建议对目标表执行ANALYZA TABLE。 库名,表名中包含保留特殊字符时无法正常统计,包括“/”和“#p#p”。 目前只支持RDS for MySQL 5.7和8.0版本。 实例内存大于85%或者实例总计表数量超过5万时,为了不影响实例,不会采集数据。 图6 TOP 50库 单击“查看趋势”,可以查看近7天、近30天、自定义时间段(时间跨度在30天内)的数据量变化情况。 图7 查看数据趋势
  • 磁盘空间分布 支持查看实例磁盘空间的分布情况。 图5 磁盘空间分布 如果磁盘空间(包括数据空间、Binlog、Slowlog、Relaylog、Audit log、临时空间、其他空间)对应的文件总数超过1万个,界面上不会展示磁盘空间分布数据和空间变化趋势,避免采集大量文件信息消耗性能,请联系技术支持处理。 数据空间:存放用户数据(包括临时表文件)的磁盘空间。 Binlog:存放Binlog日志的磁盘空间。 Slowlog:存放慢日志的磁盘空间。 Relaylog:存放Relaylog日志的磁盘空间。 Audit log:存放审计日志的磁盘空间。 临时空间:存放临时文件的磁盘空间。 其他空间:存放数据库生成的ib_buffer_pool、ib_doublewrite、error.log等文件的磁盘空间。
  • 操作场景 RDS for SQL Server具有强大的死锁检测功能。当多个用户同时访问同一资源时,可能会出现死锁现象,即两个或多个进程互相等待对方释放资源,导致所有进程都无法继续执行。此时,SQL Server将选择其中一个进程终止(Kill),其他进程就可以完成其事务。 为解决上述问题,提供了锁统计页面。通过查看该页面,可快速定位数据库中发生的多种类型的死锁。死锁的详细信息页面展示了事务开始执行的时间、会话ID、被锁资源详情、死锁的模式等信息,帮助您定位和优化引发死锁的问题SQL及其他异常。
  • 功能列表 智能DBA支持以下功能,详情请参见表1。 表1 功能说明 功能 描述 相关文档 实例概览 提供数据库整体运行情况,包括告警统计、资源使用情况和重点性能指标,多方面实时展示实例的运行状态。基于运行数据结合智能算法对实例进行健康智能诊断,并对异常项提供解决方法与使用建议。 查看实例运行情况 实时会话 提供当前数据库的会话查询列表,并支持排序过滤展示。通过设置慢会话阈值来识别异常会话应对紧急实例恢复,保障数据库的可用性。 查看会话统计结果 设置慢会话阈值 实时性能 展示数据库实例各项性能指标,并提供日期对比功能,方便查看周期业务以及指标变化情况,及时发现异常。 查看性能指标 容量预估 数据库实例在使用过程中,当前磁盘空间数据与日志的占比以及历史上涨情况往往是用户关心的重点。智能DBA助手提供了容量预估功能,可以方便地查看磁盘空间概况与分布,并通过历史数据结合智能算法提供了空间预估等功能,尽早发现空间不足的情况并及时避免出现“磁盘空间满”问题。 查看磁盘空间 查看表智能诊断 设置诊断阈值 查看库表大小 慢SQL 提供指定时间段内的慢SQL分析功能。从用户、客户端、SQL模板等进行多维统计,展示统计结果并支持指定排序,识别慢SQL的精准来源,方便用户快速优化业务。 查看慢SQL SQL限流 针对新上业务不能及时优化SQL导致CPU等资源100%瓶颈的场景,按照SQL限流规则及时控制并发数过高的SQL语句,保证实例稳定性。 设置SQL限流规则 自治限流 该功能自动检测数据库的CPU利用率、活跃会话数等异常,根据业务优先级进行限流处理,保证核心业务的稳定运行。 用户可以根据业务情况,按照数据库或者用户进行限流。将非核心数据库或非核心用户业务配置为限流对象,可以保障核心业务不受影响。 配置自治限流 诊断日报 对前一日实例状态的汇总展示,包括慢SQL分析、性能与磁盘分析。支持用户下载和订阅分析报告。建议每天定时对实例进行诊断,以保证实例上业务的正常运转。 查看诊断报告 订阅诊断报告
  • 使用场景 紧急恢复实例场景中,通过设置慢会话阈值帮助用户快速识别异常会话并手动结束该会话,使得数据库恢复正常,提高数据库的可用性。 新业务中出现并发数过高的SQL语句导致实例不稳定场景中,通过设置SQL限流规则功能控制并发数过高的SQL语句,保证实例的稳定性。 出现“磁盘空间满”问题时,通过查看磁盘空间功能实时了解磁盘空间概况与分布。您可以开启智能扩容,开启后当存储空间过小时,会自动扩容存储空间,保障数据库正常运行。 在突发流量过高、异常读写等业务场景中,通过配置自治限流功能控制活跃连接数来保障核心业务访问的可用性。
  • 功能限制 新增的SQL限流规则仅对当前实例生效。 当SQL语句匹配多条限流规则时,优先生效最新添加的规则,之前的规则不再生效。 在添加SQL限流规则之前,已经开始执行的SQL语句,不会被记入并发数。 如果复制时延过长,只读实例新增或删除限流规则时,不会立刻生效。 建议内核小版本升级至最新版本。 以下场景不受SQL限流的限制: 系统表不限制。 不涉及数据查询的不限制,例如:SELECT sleep(xxx); root账户不限制。 对存储过程,触发器,函数内的SQL语句不限制。
  • Top20表 展示空间占用Top20的数据表详细信息。不支持展示包含非英文字符集的表名。 图7 表信息 表5 表参数说明 参数 说明 表名 表的名称。 保留大小 表文件总的保留大小。 数据空间 表数据占用的总空间。 索引空间 表索引占用的总空间。 可用空间 表可用空间。 行数 表中数据的总行数。 索引数量 表中建立的索引数量。 创建时间 表创建时间,格式受实例字符集影响。 在表列表,单击“查看趋势”,可以查看近7天、近30天、自定义时间段内表的空间变化趋势。 图8 表数据趋势
  • Top20库 展示空间占用Top20的数据库详细信息,包括库文件信息。 图4 库信息 表3 库参数说明 参数 说明 数据库 数据库名。 状态 数据库状态。 总空间(MB) 当前单库总的占用空间,单位MB。 已使用(MB) 当前单库已使用空间,单位MB。 可用空间(MB) 当前单库剩余可用空间,单位MB。 日志已使用(MB) 当前单库事务日志已使用空间,单位MB。 日志可用(MB) 当前单库事务日志可用空间,单位MB。 在数据库列表,单击“查看趋势”,可以查看近7天、近30天、自定义时间段内库的空间变化趋势。 图5 库数据趋势 单击数据库前面的,可打开当前库所包含的库文件列表。 表4 库文件列表参数说明 参数 说明 文件组 文件所在的文件组名,Log文件的文件组为NULL。 文件类型 文件的类型,通常为Data、Log或Filestream类型。 文件名 数据库文件的名称。 总空间大小(MB) 文件占用的总空间,单位MB。 已使用空间(MB) 文件已使用空间,单位MB。 可用空间(MB) 文件可用空间,单位MB。 文件最大限制(MB) 文件空间最大限制,单位MB,值为-1时表示不受限制。 文件自动增长量 文件自动增长的步长单位,固定值单位MB,或百分比。 在库文件列表,勾选单个或多个文件,单击“批量文件收缩”,执行文件收缩命令(master、msdb、model、rdsadmin库限制下发)。 图6 批量文件收缩
  • 健康智能诊断 在“实例概览”页签的“健康智能诊断”模块,查看实时诊断结果,默认展示高压力请求、内存超限风险、慢SQL高频和锁等待的诊断结果。 针对诊断异常的指标,单击“详情与优化”查看诊断详情及优化建议,详情请参见表1。 图3 健康智能诊断 表1 健康智能诊断及优化 诊断项目 异常触发条件 优化案例 高压力请求 满足其一即触发异常诊断: 收到用户通过CES配置的“CPU利用率”的告警后 连续5min内“CPU利用率”有超过一半时间超过95% GaussDB(for MySQL) CPU使用率高的解决方法 内存超限风险 满足其一即触发异常诊断: 收到用户通过CES配置的“内存使用率”告警后 或者5min存在“内存使用率”超过95%情况 长事务产生大量临时表导致内存超限的解决办法 慢SQL高频 满足其一即触发异常诊断: 收到了户通过CES配置的“慢日志个数统计”阈值的告警后 或者连续5min“慢日志个数统计”超过100 联合索引设置不当导致慢SQL的解决办法 锁等待 收到了用户通过CES配置的如下告警中的任意一个 行锁花费时间 InnoDB行锁数量 行锁等待数 持锁长事务导致后续业务报等锁超时的解决办法 通过CES配置告警规则,详情请参见创建实例告警规则。 监控指标的详情内容请参见支持的监控指标。