云服务器内容精选

  • 智能运维概览 GaussDB(DWS)提供智能运维功能,帮助用户快速高效地执行运维任务。智能运维会根据集群负载情况,选择合理时间窗、并发度完成用户指定的任务。在运维任务执行过程中,智能运维会时刻关注用户业务的变化,及时调整运维任务执行策略,以减轻对用户业务的影响。智能运维支持周期型和单次型任务的创建,执行时间窗可按照不同用户业务负载定制化。 智能运维具备一定的高可用性,在集群异常的情况下,智能运维将重新执行失败的运维任务,若由于集群异常导致运维任务部分步骤无法完成,智能运维将尝试跳过失败的步骤,以节省用户运维时间窗开销。 智能运维界面主要由以下部分构成: 运维任务公共配置:目前仅包含“用户表VacuumFull运维任务最大并发数”,该配置应用于每个用户表VacuumFull的运维任务。 进行中的运维任务:显示正在运行的运维任务信息(目前仅支持Vacuum运维任务,用户数据膨胀,磁盘内存不足可进行Vacuum操作,详情请参见数据膨胀磁盘空间不足,导致性能降低)。 用户频繁创建、删除表,导致系统表膨胀严重,可对系统表执行Vacuum。 用户频繁执行UPDATE、DELETE语句,导致用户表膨胀严重,可对用户表执行Vacuum/Vacuum Full。 运维详情:运维详情包括两部分,运维计划和运维状态。运维计划将展示全部运维任务基本信息,运维状态将展示运维任务运行状态信息。 该特性仅8.1.3及以上版本支持。 智能运维功能暂不支持实时数仓(单机部署)。 运维任务公共配置模块仅8.1.3及以上集群版本支持,历史版本需要联系技术支持人员升级使用。 父主题: 智能运维
  • 操作步骤 登录云搜索服务管理控制台。 在集群管理页面,单击需要进行智能运维的集群名称,跳转至该集群基本信息页面。 选择“智能运维”。 在智能运维列表页面,单击左上角的“启动检测”。 在对话框中填写检测任务的基本信息,单击“确定”。 表1 检测任务基本信息说明 参数 说明 名称 检测任务的名称。 描述 检测任务的简短描述。 SMN主题 如果勾选“任务完成后发送SMN告警”,可选择当前账号已创建的SMN主题。 如果未创建SMN主题,请先前往SMN服务创建主题。 告警灵敏度 如果勾选“任务完成后发送SMN告警”,可选择告警灵敏度。 检测到的风险项存在大于等于此风险敏感度的条目,则发送SMN告警消息,消息内容则包含所有风险项。 创建检测任务后,可在智能运维列表查看新创建的检测任务。
  • 检测项 检测任务会从如下项目对集群进行检测,如存在风险,可在智能运维列表查看风险项。 检查当前时刻集群的健康状态,其中red表示有主分片未分配,yellow表示有副分片未分配,green表示所有分片均已分配。 检测集群节点数与AZ(可用区)数,判定Elasticsearch分布式集群的高可用性。 检测集群索引是否开启副本,未设置副本的索引在节点发生故障后可能导致索引不可用,本地盘集群未设置副本会有数据丢失的风险。 检测集群是否存在kibana索引冲突。 检测节点磁盘用量百分比,节点磁盘存储过大可能导致节点无法分配新索引分片并影响集群性能。 检测集群数据节点/冷数据节点的存储用量是否均衡,不均衡的存储用量分布可能导致集群负载不均,读写延迟增加。 连续5分钟检测当前集群是否有节点脱离或不可用。 检测节点分片数量是否过多,单节点分片数量过多会消耗大量节点资源,读写请求时延增加,集群元数据更新缓慢等。 检测所有分片大小,分片太大可能导致查询性能下降,节点内存消耗增加,影响扩缩容以及节点故障时分片的恢复速率等。 检测当前集群是否存在可升级的版本。 检测集群7天内是否有快照备份失败,或7天内无快照备份记录。
  • 操作步骤 登录云搜索服务管理控制台。 在集群管理页面,单击需要进行智能运维的集群名称,跳转至该集群基本信息页面。 选择“智能运维”。 在智能运维列表页面,单击左上角的“启动检测”。 在对话框中填写检测任务的基本信息,单击“确定”。 表1 检测任务基本信息说明 参数 说明 名称 检测任务的名称。 描述 检测任务的简短描述。 SMN主题 如果勾选“任务完成后发送SMN告警”,可选择当前账号已创建的SMN主题。 如果未创建SMN主题,请先前往SMN服务创建主题。 告警灵敏度 如果勾选“任务完成后发送SMN告警”,可选择告警灵敏度。 检测到的风险项存在大于等于此风险敏感度的条目,则发送SMN告警消息,消息内容则包含所有风险项。 创建检测任务后,可在智能运维列表查看新创建的检测任务。
  • 库表大小统计 可查看物理文件大小Top50库表,结合磁盘空间的分布情况,识别占用较高的库表并进行优化。 图6 查看TOP 50库表 单击“查看趋势”,可以查看近7天、近30天、自定义时间段(时间跨度在30天内)的数据量变化情况。 图7 查看趋势 数据管理服务每天凌晨4点左右会进行自动采集一次数据。 物理文件大小为精确采集数据,其余指标为预估值(存在误差),如差距较大建议对目标表执行ANALYZA TABLE。 库名或表名中包含保留特殊字符时无法正常统计,包括“/”和“#p#p”。 目前只支持RDS for MySQL 5.7和8.0版本。 实例总计表数量超过5万时,为了不影响实例,不会采集数据。 由于Top库表可能存在波动,趋势数据可能存在部分缺失。
  • 查看磁盘空间分布 支持查看实例磁盘空间的分布情况及磁盘空间的变化趋势。 图5 查看磁盘空间分布 数据空间:存放用户数据的磁盘空间。 Binlog:存放Binlog日志的磁盘空间。 Slowlog:存放慢日志的磁盘空间。 Relaylog:存放Relaylog日志的磁盘空间。 Audit log:存放审计日志的磁盘空间。 临时空间:存放临时文件的磁盘空间。 其他空间:操作系统预留空间,Linux操作系统会给系统用户预留一部分磁盘空间,系统预留大小预计是磁盘5%左右。
  • 表智能诊断 表智能诊断可以帮助您诊断“单表空间增长异常表”、“无主键表”、“无索引表”的异常情况。 表智能诊断支持自动诊断和手动诊断两种方式。 免费实例暂不支持表智能诊断功能,您可以在设置付费实例或者升级高级智能运维包后,使用该功能。 当表的数量超过5000张时,无法使用手动诊断功能。 当CPU利用率超过90%时,无法使用手动诊断功能。 自动诊断范围为:容量预估页面下方展示的表列表中Top50内的表,手动诊断无范围限制。 在“表智能诊断”区域,查看表智能诊断信息。 图3 表智能诊断 自动诊断 自动诊断将在每天凌晨4点左右自动进行一次。 您可以在表智能诊断左侧区域查看到近一天磁盘容量空间增长异常的表数量,单击具体的数字可以查看诊断详情。 近一天空间增长默认超过10240MB(即10GB)时,会报告异常。您也可以单击自动诊断右侧的,自定义诊断阈值。 手动诊断 单击“重新诊断”,手动触发诊断任务。该操作每5分钟可执行一次。 待诊断成功后,可以查看到无主键表和无索引表的数量,单击具体数字可以查看诊断详情。 图4 查看诊断详情
  • 功能模块 实例概览页面从多个模块为用户展示实例的运行情况,各功能模块详情请参见表1。 表1 功能说明 功能模块 说明 告警统计 查看实例运行中不同等级告警条数。单击告警数,可以跳转至告警规则页面,显示该告警等级下的所有告警规则。 健康智能诊断 基于运行数据结合智能算法对实例进行整体诊断,帮助您所见即所得了解实例的健康情况。 资源使用情况 查看实例的CPU利用率、内存利用率、磁盘空间利用率和磁盘IOPS指标数。 重点性能指标 查看实例的近一小时的重点性能指标,包括CPU和慢SQL数、连接数、内存使用率、硬盘读写吞吐量。
  • 库表大小统计 可查看物理文件大小Top50库表,结合磁盘空间的分布情况,识别占用较高的库表并进行优化。 图6 查看TOP 50库表 单击“查看趋势”,可以查看近7天、近30天、自定义时间段(时间跨度在30天内)的数据量变化情况。 图7 查看趋势 数据管理服务每天凌晨4点左右会进行自动采集一次数据。 物理文件大小为精确采集数据,其余指标为预估值(存在误差),如差距较大建议对目标表执行ANALYZA TABLE。 库名或表名中包含保留特殊字符时无法正常统计,包括“/”和“#p#p”。 实例总计表数量超过5万时,为了不影响实例,不会采集数据。 由于Top库表可能存在波动,趋势数据可能存在部分缺失。
  • 查看磁盘空间分布 支持查看实例磁盘空间的分布情况及磁盘空间的变化趋势。 图5 查看磁盘空间分布 数据空间:存放用户数据的磁盘空间。 Binlog:存放Binlog日志的磁盘空间。 Slowlog:存放慢日志的磁盘空间。 Relaylog:存放Relaylog日志的磁盘空间。 Audit log:存放审计日志的磁盘空间。 临时空间:存放临时文件的磁盘空间。 其他空间:操作系统预留空间,Linux操作系统会给系统用户预留一部分磁盘空间,系统预留大小预计是磁盘5%左右。
  • 表智能诊断 表智能诊断可以帮助您诊断“单表空间增长异常表”、“无主键表”、“无索引表”的异常情况。 表智能诊断支持自动诊断和手动诊断两种方式。 免费实例暂不支持表智能诊断功能,您可以在设置付费实例或者升级高级智能运维包后,使用该功能。 当表的数量超过5000张时,无法使用手动诊断功能。 当CPU利用率超过90%时,无法使用手动诊断功能。 自动诊断范围为:容量预估页面下方展示的表列表中Top50内的表,手动诊断无范围限制。 在“表智能诊断”区域,查看表智能诊断信息。 图3 表智能诊断 自动诊断 自动诊断将在每天凌晨4点左右自动进行一次。 您可以在表智能诊断左侧区域查看到近一天磁盘容量空间增长异常的表数量,单击具体的数字可以查看诊断详情。 近一天空间增长默认超过10240MB(即10GB)时,会报告异常。您也可以单击自动诊断右侧的,自定义诊断阈值。 手动诊断 单击“重新诊断”,手动触发诊断任务。该操作每5分钟可执行一次。 待诊断成功后,可以查看到无主键表和无索引表的数量,单击具体数字可以查看诊断详情。 图4 查看诊断详情
  • 功能模块 实例概览页面从多个模块为用户展示实例的运行情况,各功能模块详情请参见表1。 表1 功能说明 功能模块 说明 告警统计 查看实例运行中不同等级告警条数。单击告警数,可以跳转至告警规则页面,显示该告警等级下的所有告警规则。 健康智能诊断 基于运行数据结合智能算法对实例进行整体诊断,帮助您所见即所得了解实例的健康情况。 资源使用情况 查看实例的CPU利用率、内存利用率、磁盘空间利用率和磁盘IOPS指标数。 重点性能指标 查看实例的近一小时的重点性能指标,包括CPU和慢SQL数、连接数、内存使用率、硬盘读写吞吐量。
  • 操作步骤 在数据管理服务左侧的导航栏中单击“DBA智能运维”页签,进入DBA智能运维实例总览页面,单击实例页面的“恢复免费”。 图1 恢复成免费实例 请仔细阅读弹窗内容,确认无误后单击“是”将实例恢复成免费实例。 图2 恢复成免费实例弹窗 若实例设置为付费实例不足5分钟,将会出现如下警告,请在提示时间之后将实例恢复成免费实例。 图3 警告 若实例设置为付费实例超过5分钟,恢复完成后,实例总览页面该实例显示为“免费实例”。 图4 实例总览页面