云服务器内容精选

  • 添加运维计划 登录GaussDB(DWS)管理控制台。 在集群列表中单击指定集群名称。 进入“集群详情”页面,切换至“智能运维”页签。 在运维详情部分切换至运维计划模块。单击“添加运维任务”按钮。 在弹出的添加运维任务边栏,进行运维任务的基础配置。 表1 运维任务基础配置项 配置项名称 配置项描述 样例 运维任务 Vacuum(目前仅支持Vacuum运维任务)。 Vacuum 任务简介 智能任务的简要描述。 该运维任务可帮助用户定期调用系统Vacuum命令,以实现空间回收。 备注 备注信息。 - 调度模式 支持以下三种调度模式: 自动:智能运维将在指定时间窗内扫描数据库,依据用户业务负载、用户表可回收空间,自动下发表级Vacuum任务。 指定目标:用户可选择指定Vacuum目标,智能运维将在指定时间窗内,自动下发表级Vacuum任务。 优先级模式:用户可配置优先Vacuum目标,若时间窗剩余,智能运维将自动扫描其他可Vacuum的表,并下发表级Vacuum任务。 说明: 建议使用指定目标方式进行Vacuum和VacuumFull,同时不建议对列存宽表进行VacuumFull,以防止内存膨胀。 指定目标 自动Vacuum目标 支持:系统表Vacuum或用户表VacuumFull。 对于系统表Vacuum,会持有系统表五级锁(share update exclusive锁),不会阻塞用户业务,仅会阻塞系统表DDL进程。 对于用户表Vacuum Full,会持有系统表的八级锁(access exclusive锁),期间所有访问会被阻塞,并等待Vacuum Full结束,建议用户合理安排调度时间,在业务负载低峰期执行Vacuum Full操作,避免锁表影响业务。 注意: Vacuum Full操作相当于开辟一块和表数据大小相同的空间(表真实数据大小约为表总大小* (1 – 脏页率)),因此表空间会先增后降,请提前计算好Vacuum Full所需要的空间再行处理。 用户表VacuumFull 优先Vacuum目标 用户可配置优先Vacuum目标,其中一行对应一张表,每张表以数据库名、模式名、表名表示,以空格进行分割。 - 高级配置 选择“自定义”时,可以设置Vacuum膨胀率和目标表可回收空间高级配置参数(满足其中一个条件即触发自动Vacuum),如果选择“默认配置”,将使用它们的默认值。 说明: Vacuum膨胀率:在数据库中频繁执行UPDATE、DELETE等操作后被删除或更新的行不会从表中物理删除,仅从数据库中被逻辑删除,在完成VACUUM之前这些过期数据仍然存储在磁盘中,从而导致表膨胀。当膨胀率达到运维任务中用户设置的百分比后,就会自动触发Vacuum。 默认配置(Vacuum膨胀率80%;目标表可回收空间100GB) 单击“下一步:定时配置”,进行运维任务的“定时配置”。 选择运维类型: 单次型任务:需要设置起止时间,智能运维将在设置的时间段内运行运维任务。 周期型任务:需要配置时间窗,时间窗配置提供每日、每周、每月三种类型供用户选择。智能运维将自动分析用户注册的时间段,在每个时间段内运行运维任务。 对于自动Vacuum运维任务,用户配置时间窗时,应避开业务高峰期。否则自动Vacuum将有可能与用户业务产生死锁冲突。 vacuum(full)运维任务对于用户表并发度最高为24,最低为0;对于系统表并发度最高为1,最低为0。并发度不支持用户自定义,但可根据系统io_util自动调节: io_util将0%~60%划分为两个区间段: 0%~30%区间段,io_util每减少15%,并发度增加2。 30%~60%区间段,io_util值每减少15%,并发度增加1。 60%~70%并发度不变。 70%以上并发度减1,如果仍维持70%以上IO,则并发度持续减到0。 调度器会在时间窗内,扫描列存小CU膨胀情况,若发现列存CU膨胀(列存CU的膨胀依据是CU平均记录数小于1000),则调度器会将该列存表优先级提前。列存CU膨胀检测条件不受膨胀率、可回收空间限制。 优先级表最多支持添加100个任务表。 调度器自动vacuum功能依赖于统计信息,若统计信息不准确,可能会影响调度器自动vacuum执行顺序以及统计结果。 调度器不支持带有空格和单引号的表,包括数据库名,schema名,表名。如果vacuum在扫描过程中遇到带有单引号或空格的表,将自动跳过。对于优先级表中有空格或单引号的表,也自动跳过。 单击“下一步:配置确认”,确认无误后单击“配置确认”提交。
  • 运维任务公共配置 登录GaussDB(DWS)管理控制台。 在集群列表中单击指定集群名称。 进入“集群详情”页面,切换至“智能运维”页签。 在页面上方“运维任务公共配置”模块,填写“用户表VacuumFull运维任务最大并发数”配置值,单击右上角“保存”完成配置。 该配置应用于每个用户表VacuumFull运维任务中。 最大并发数配置范围为1~24,用户可根据剩余磁盘空间和IO负载,合理设置最大并发数,建议设置为5。
  • 操作步骤 登录云搜索服务管理控制台。 在集群管理页面,单击需要进行智能运维的集群名称,跳转至该集群基本信息页面。 选择“智能运维”。 在智能运维列表页面,单击左上角的“启动检测”。 在对话框中填写检测任务的基本信息,单击“确定”。 表1 检测任务基本信息说明 参数 说明 名称 检测任务的名称。 描述 检测任务的简短描述。 SMN主题 如果勾选“任务完成后发送SMN告警”,可选择当前账号已创建的SMN主题。 如果未创建SMN主题,请先前往SMN服务创建主题。 告警灵敏度 如果勾选“任务完成后发送SMN告警”,可选择告警灵敏度。 检测到的风险项存在大于等于此风险敏感度的条目,则发送SMN告警消息,消息内容则包含所有风险项。 创建检测任务后,可在智能运维列表查看新创建的检测任务。
  • 检测项 检测任务会从如下项目对集群进行检测,如存在风险,可在智能运维列表查看风险项。 检查当前时刻集群的健康状态,其中red表示有主分片未分配,yellow表示有副分片未分配,green表示所有分片均已分配。 检测集群节点数与AZ(可用区)数,判定Elasticsearch分布式集群的高可用性。 检测集群索引是否开启副本,未设置副本的索引在节点发生故障后可能导致索引不可用,本地盘集群未设置副本会有数据丢失的风险。 检测集群是否存在kibana索引冲突。 检测节点磁盘用量百分比,节点磁盘存储过大可能导致节点无法分配新索引分片并影响集群性能。 检测集群数据节点/冷数据节点的存储用量是否均衡,不均衡的存储用量分布可能导致集群负载不均,读写延迟增加。 连续5分钟检测当前集群是否有节点脱离或不可用。 检测节点分片数量是否过多,单节点分片数量过多会消耗大量节点资源,读写请求时延增加,集群元数据更新缓慢等。 检测所有分片大小,分片太大可能导致查询性能下降,节点内存消耗增加,影响扩缩容以及节点故障时分片的恢复速率等。 检测当前集群是否存在可升级的版本。 检测集群7天内是否有快照备份失败,或7天内无快照备份记录。
  • 操作步骤 登录云搜索服务管理控制台。 在集群管理页面,单击需要进行智能运维的集群名称,跳转至该集群基本信息页面。 选择“智能运维”。 在智能运维列表页面,单击左上角的“启动检测”。 在对话框中填写检测任务的基本信息,单击“确定”。 表1 检测任务基本信息说明 参数 说明 名称 检测任务的名称。 描述 检测任务的简短描述。 SMN主题 如果勾选“任务完成后发送SMN告警”,可选择当前账号已创建的SMN主题。 如果未创建SMN主题,请先前往SMN服务创建主题。 告警灵敏度 如果勾选“任务完成后发送SMN告警”,可选择告警灵敏度。 检测到的风险项存在大于等于此风险敏感度的条目,则发送SMN告警消息,消息内容则包含所有风险项。 创建检测任务后,可在智能运维列表查看新创建的检测任务。
  • 库表大小统计 可查看物理文件大小Top50库表,结合磁盘空间的分布情况,识别占用较高的库表并进行优化。 图6 查看TOP 50库表 单击“查看趋势”,可以查看近7天、近30天、自定义时间段(时间跨度在30天内)的数据量变化情况。 图7 查看趋势 数据管理服务每天凌晨4点左右会进行自动采集一次数据。 物理文件大小为精确采集数据,其余指标为预估值(存在误差),如差距较大建议对目标表执行ANALYZA TABLE。 库名或表名中包含保留特殊字符时无法正常统计,包括“/”和“#p#p”。 目前只支持RDS for MySQL 5.7和8.0版本。 实例总计表数量超过5万时,为了不影响实例,不会采集数据。 由于Top库表可能存在波动,趋势数据可能存在部分缺失。
  • 表智能诊断 表智能诊断可以帮助您诊断“单表空间增长异常表”、“无主键表”、“无索引表”的异常情况。 表智能诊断支持自动诊断和手动诊断两种方式。 免费实例暂不支持表智能诊断功能,您可以在设置付费实例或者升级高级智能运维包后,使用该功能。 当表的数量超过5000张时,无法使用手动诊断功能。 当CPU利用率超过90%时,无法使用手动诊断功能。 自动诊断范围为:容量预估页面下方展示的表列表中Top50内的表,手动诊断无范围限制。 在“表智能诊断”区域,查看表智能诊断信息。 图3 表智能诊断 自动诊断 自动诊断将在每天凌晨4点左右自动进行一次。 您可以在表智能诊断左侧区域查看到近一天磁盘容量空间增长异常的表数量,单击具体的数字可以查看诊断详情。 近一天空间增长默认超过10240MB(即10GB)时,会报告异常。您也可以单击自动诊断右侧的,自定义诊断阈值。 手动诊断 单击“重新诊断”,手动触发诊断任务。该操作每5分钟可执行一次。 待诊断成功后,可以查看到无主键表和无索引表的数量,单击具体数字可以查看诊断详情。 图4 查看诊断详情
  • 查看磁盘空间分布 支持查看实例磁盘空间的分布情况及磁盘空间的变化趋势。 图5 查看磁盘空间分布 数据空间:存放用户数据的磁盘空间。 Binlog:存放Binlog日志的磁盘空间。 Slowlog:存放慢日志的磁盘空间。 Relaylog:存放Relaylog日志的磁盘空间。 Audit log:存放审计日志的磁盘空间。 临时空间:存放临时文件的磁盘空间。 其他空间:操作系统预留空间,Linux操作系统会给系统用户预留一部分磁盘空间,系统预留大小预计是磁盘5%左右。
  • 功能模块 实例概览页面从多个模块为用户展示实例的运行情况,各功能模块详情请参见表1。 表1 功能说明 功能模块 说明 告警统计 查看实例运行中不同等级告警条数。单击告警数,可以跳转至告警规则页面,显示该告警等级下的所有告警规则。 健康智能诊断 基于运行数据结合智能算法对实例进行整体诊断,帮助您所见即所得了解实例的健康情况。 资源使用情况 查看实例的CPU利用率、内存利用率、磁盘空间利用率和磁盘IOPS指标数。 重点性能指标 查看实例的近一小时的重点性能指标,包括CPU和慢SQL数、连接数、内存使用率、硬盘读写吞吐量。
  • 查看磁盘空间分布 支持查看实例磁盘空间的分布情况及磁盘空间的变化趋势。 图5 查看磁盘空间分布 数据空间:存放用户数据的磁盘空间。 Binlog:存放Binlog日志的磁盘空间。 Slowlog:存放慢日志的磁盘空间。 Relaylog:存放Relaylog日志的磁盘空间。 Audit log:存放审计日志的磁盘空间。 临时空间:存放临时文件的磁盘空间。 其他空间:操作系统预留空间,Linux操作系统会给系统用户预留一部分磁盘空间,系统预留大小预计是磁盘5%左右。
  • 库表大小统计 可查看物理文件大小Top50库表,结合磁盘空间的分布情况,识别占用较高的库表并进行优化。 图6 查看TOP 50库表 单击“查看趋势”,可以查看近7天、近30天、自定义时间段(时间跨度在30天内)的数据量变化情况。 图7 查看趋势 数据管理服务每天凌晨4点左右会进行自动采集一次数据。 物理文件大小为精确采集数据,其余指标为预估值(存在误差),如差距较大建议对目标表执行ANALYZA TABLE。 库名或表名中包含保留特殊字符时无法正常统计,包括“/”和“#p#p”。 实例总计表数量超过5万时,为了不影响实例,不会采集数据。 由于Top库表可能存在波动,趋势数据可能存在部分缺失。
  • 表智能诊断 表智能诊断可以帮助您诊断“单表空间增长异常表”、“无主键表”、“无索引表”的异常情况。 表智能诊断支持自动诊断和手动诊断两种方式。 免费实例暂不支持表智能诊断功能,您可以在设置付费实例或者升级高级智能运维包后,使用该功能。 当表的数量超过5000张时,无法使用手动诊断功能。 当CPU利用率超过90%时,无法使用手动诊断功能。 自动诊断范围为:容量预估页面下方展示的表列表中Top50内的表,手动诊断无范围限制。 在“表智能诊断”区域,查看表智能诊断信息。 图3 表智能诊断 自动诊断 自动诊断将在每天凌晨4点左右自动进行一次。 您可以在表智能诊断左侧区域查看到近一天磁盘容量空间增长异常的表数量,单击具体的数字可以查看诊断详情。 近一天空间增长默认超过10240MB(即10GB)时,会报告异常。您也可以单击自动诊断右侧的,自定义诊断阈值。 手动诊断 单击“重新诊断”,手动触发诊断任务。该操作每5分钟可执行一次。 待诊断成功后,可以查看到无主键表和无索引表的数量,单击具体数字可以查看诊断详情。 图4 查看诊断详情
  • 功能模块 实例概览页面从多个模块为用户展示实例的运行情况,各功能模块详情请参见表1。 表1 功能说明 功能模块 说明 告警统计 查看实例运行中不同等级告警条数。单击告警数,可以跳转至告警规则页面,显示该告警等级下的所有告警规则。 健康智能诊断 基于运行数据结合智能算法对实例进行整体诊断,帮助您所见即所得了解实例的健康情况。 资源使用情况 查看实例的CPU利用率、内存利用率、磁盘空间利用率和磁盘IOPS指标数。 重点性能指标 查看实例的近一小时的重点性能指标,包括CPU和慢SQL数、连接数、内存使用率、硬盘读写吞吐量。
  • 操作步骤 在数据管理服务左侧的导航栏中单击“DBA智能运维”页签,进入DBA智能运维实例总览页面,单击实例页面的“恢复免费”。 图1 恢复成免费实例 请仔细阅读弹窗内容,确认无误后单击“是”将实例恢复成免费实例。 图2 恢复成免费实例弹窗 若实例设置为付费实例不足5分钟,将会出现如下警告,请在提示时间之后将实例恢复成免费实例。 图3 警告 若实例设置为付费实例超过5分钟,恢复完成后,实例总览页面该实例显示为“免费实例”。 图4 实例总览页面