云服务器内容精选

  • RabbitMQ 3.x.x版本实例 RabbitMQ 3.x.x版本实例在监控页面中,队列名称存在两种显示。如果队列在默认Vhost下,会直接显示队列名。如果队列不在默认Vhost下,队列名称显示为:队列所在的Vhost名称__队列名。例如:队列test01在Vhost-13142708中,此时监控中显示的队列名为“Vhost-13142708__test01”。 RabbitMQ 3.x.x版本实例的队列名称或Vhost名称属于以下任一情况时,可能会导致监控数据无法展示。 RabbitMQ的队列名称以特殊字符开头,例如点号“.”。建议删除带特殊字符的队列。 RabbitMQ的Vhost名称以特殊字符开头,例如点号“.”。建议删除带特殊字符的Vhost。 图1 无法展示监控 RabbitMQ 3.x.x版本实例的队列名称或Vhost名称包含特殊字符,例如“%”、“|”、“/”,会导致队列/Vhost名称与监控页面不一致,在监控页面中特殊字符会以“_”显示。例如:队列Queue.1%1|2_3/在默认Vhost中,此时监控中显示的队列名为“Queue.1_1_2_3_”。 图2 Vhost详情页的队列名称 图3 监控页的队列名称
  • RabbitMQ AMQP-0-9-1版本实例 RabbitMQ AMQP-0-9-1版本实例的Queue名称、Vhost名称或Exchange名称包含特殊字符,例如“%”、“|”、“/”、“.”,会导致Queue名称、Vhost名称、Exchange名称与监控页面不一致,在监控页面中特殊字符会以“_”显示。例如:Queue名称为Queue.1%1|2_3/,此时监控中显示的Queue名为“Queue_1_1_2_3_”。 图4 Vhost详情页的Queue名称 图5 监控页的Queue名称
  • 监控指标中存在已拒绝的连接数是什么原因? 当监控指标中出现“已拒绝的连接数”时,请确认客户端连接数是否已经超过实例的最大连接数限制。 Redis 4.0及以上版本的实例,仅在主备、集群和读写分离实例的数据节点中支持查看“已拒绝的连接数”。 查看最大连接数:单击实例名称,进入实例详情页面,选择“配置参数”页签,查看maxclients参数的值(读写分离实例暂不支持该参数,可通过D CS 实例规格查询实例最大连接数)。 查看实际连接数:单击实例名称,进入实例详情页面,选择“性能监控”页签,找到“活跃的客户端数量”监控项查看。 如果客户端连接数已到达连接上限,可以根据需要调整maxclients参数,如果maxclients参数已经是最大可配连接数,仍不满足需求,则需要考虑增加实例分片。 父主题: 监控告警
  • 触发流控(限流)的原因和处理建议 什么是流控 DCS针对实例每个节点做了带宽消耗的限制,当某个节点短时间内消耗的带宽超过该节点的带宽限制(最大带宽)时,该节点会暂时不对客户端命令进行处理,以达到控制流量的目的,即产生流控。因此,Redis产生流控,说明Redis在周期内的使用流量超过该实例规格的最大带宽。 实例默认的最大带宽,可以查看实例规格中对应实例类型的“基准/最大带宽”。如果实例进行了调整带宽,最大带宽请以调整后的带宽为准。 如何判断是否产生流控 判断是否产生流控,请通过查看流控次数的监控指标,该指标大于0时,表示当前已使用的带宽超过最大带宽限制,产生流控。 带宽使用率不高时,也有可能有限流,因为带宽使用率是上报周期实时值,一个上报周期检查一次。而流控检查是秒级的,有可能存在上报周期间隔期间,流量有秒级冲高,然后回落,待上报带宽使用率指标时已恢复正常。 流控的影响 Redis产生流控,会暂时停止响应该节点客户端发来的请求(DCS侧不会丢弃暂停的请求,而是跳过此次处理待下次处理),从业务角度可能会造成业务的延迟增大,客户端连接异常等问题。 对流控的处理建议 对于主备实例: 如果实例一直有流控但是带宽使用率不高,这说明可能存在业务微突发问题,或者大Key热Key问题,建议对实例进行自动诊断分析,优先排除大Key热Key问题。 如果带宽使用率居高不下,说明带宽可能存在超限风险,需要扩容实例带宽。 对于集群实例: 仅有单个或少量几个分片出现流控,则多数为该分片存在大Key热Key问题。 所有或大多数分片同时出现流控或者带宽使用率高的问题,这说明实例的带宽达到了瓶颈,建议扩容实例带宽。 DCS控制台提供了大Key和热Key的分析功能,请参考分析Redis实例大Key和热Key减少大key和热key。 如果用户执行了keys等消耗资源的命令,也可能会导致CPU和带宽使用率增加,从而出现流控。可以通过查询Redis实例运行日志排查。 通过控制台的调整DCS实例带宽功能扩容Redis实例带宽,可以解决实例带宽超限的问题。 父主题: 监控告警
  • 查看Redis实例实时并发连接数 当您需要查看DCS实例收到的实时连接数时,在控制台缓存管理页面,单击需要查看的实例右侧的“查看监控”,进入 云监控 页面。 图1 查看监控 进入监控页面后,找到“活跃的客户端数量”监控项。您可以单击该监控项的右上角的查看按钮,使用大图模式查看。 在弹出的“活跃的客户端数量”页面,根据需要选择查看的时间段,例如,需要查看10分钟内的连接数,您可以将时间自定义为10分钟。由于监控数据采集的是周期内增加的连接数,您可以通过监控图表,查看这个时间段的连接数的走势,并统计10分钟内的连接总数。 监控指标“活跃的客户端数量”用于统计已连接的客户端数量,包括系统监控、配置同步和业务相关的连接数,不包括来自从节点的连接。 您还可以通过控制台会话管理,查看连接实例的客户端会话信息。
  • RES07-03 监控到异常后发送 消息通知 当对应用系统监控发现应用异常后,需要向相应的人员和系统发送实时通知消息和告警,以便及时处理。 风险等级 中 关键策略 采用实时快捷的消息通知方式,以便相关人员能及时得到消息。 消息发送人员需要涵盖运维人员,以便及时恢复。 运维人员需要有备份,避免单点风险。 SMN 消息通知服务可依据用户需求主动推送通知消息,方式可为短信、电子邮件等。 CES AOM CTS APM 、LTS等服务均已经对接SMN消息通知服务,在阈值规则发生变化时,可以以邮件或短信等方式通知,以便您在第一时间发现异常并进行处理。 相关云服务和工具 消息通知服务 SMN 云运维中心 COC:支持人员管理、排班管理和通知管理,可以根据通知规则自动将消息发送给要通知的人员。 父主题: RES07 监控告警
  • 云监控无法展示Kafka监控数据 Topic监控数据无法展示,可能原因如下: Topic名称开头包含特殊字符,例如#号“#”。 Kafka实例中没有创建Topic。 解决方法如下: 删除带特殊字符的Topic。 创建Topic。 消费组监控数据无法展示,可能原因如下: 消费组名称开头包含特殊字符,例如#号“#”。 此消费组从未有消费者连接。 解决方法如下: 删除带特殊字符的消费组。 使用此消费组消费消息。 父主题: 监控告警问题
提示

您即将访问非华为云网站,请注意账号财产安全