华为云用户手册

  • 使用限制 支持数据库级或表级别的恢复。如需使用库表级恢复功能,请联系客服申请。 为避免恢复失败和对原数据产生影响,表级恢复会去除外键约束,继承关系,分区关系,触发器,重命名索引及相关联序列,库级恢复则不恢复订阅。 表级恢复时,单个实例一次最多恢复20000张表。当需要恢复的表数量超过20000张时,建议您使用恢复到指定时间点功能进行恢复,具体请参考将数据库实例恢复到指定时间点。 库级恢复时,单个实例一次最多恢复2000个库,单个实例一次最多恢复20000张表。如果不满足条件,建议您使用恢复到指定时间点功能进行恢复,具体请参考将数据库实例恢复到指定时间点。 RDS for PostgreSQL库表级时间点恢复期间不允许主备实例和只读实例做规格变更,重启,删除等操作。 进行库表级时间点恢复时,要恢复的库、表信息是在所选时间点前最新一次全量备份中读取的。由于所选时间点可以是恢复时间区间内的任意时间点,所以库表级时间点恢复支持恢复到存在指定库、表信息的最早的一次全量备份时间点。 如果恢复时间点表不存在,则恢复流程依旧会完成,但是不会产生对应的恢复数据。 库表级时间点恢复不支持RDS for PostgreSQL增强版。
  • 操作场景 为了保证数据的完整性,以及降低对原实例的性能影响,会进行库表级时间点恢复。库表级恢复是为选择的某个库表恢复到指定时间点。在进行库表级时间点恢复备份时,会从OBS备份空间中选择一个该时间点最近的全量备份下载到临时实例上进行全量恢复,再在临时实例上重放WAL到指定时间点,完成之后将对应库表的数据回写到原实例的目标库表,恢复时长和实例的数据量有关。 由于需要对实例的所有数据进行备份及恢复操作,对于数据量较大的实例,所需时间较长,请耐心等待。通过库表级时间点恢复备份,将不会导致实例数据被覆盖,您可以根据需要恢复库表。 RDS for PostgreSQL支持恢复单个实例的库表数据。
  • 功能列表 智能DBA支持以下功能,详情请参见表1。 表1 功能说明 功能 描述 相关文档 实例概览 提供数据库整体运行情况,包括告警统计、资源使用情况和重点性能指标,多方面实时展示实例的运行状态。基于运行数据结合智能算法对实例进行健康智能诊断,并对异常项提供解决方法与使用建议。 查看实例运行情况 实时会话 提供当前数据库会话快照查询,并支持排序过滤展示。可基于用户、访问主机、库等多维度快速过滤识别到自定义慢SQL会话、活跃会话等。KILL会话与SQL限流功能应对紧急实例恢复,保障数据库的可用性。 管理实时会话 实时性能 展示数据库实例各项关键指标,并提供日期对比功能,方便查看周期业务以及指标变化情况,及时发现异常。秒级监控有助于精准定位问题。 查看性能指标 容量预估 数据库实例在使用过程中,当前磁盘空间数据与日志的占比以及历史上涨情况往往是用户关心的重点。智能DBA助手提供了容量预估功能,可以方便地查看磁盘空间概况与分布,并通过历史数据结合智能算法提供了空间预估等功能,尽早发现空间不足的情况并及时避免。此外还提供了智能扩容、表智能诊断、TOP50库表协助运维功能。 管理磁盘容量 锁&事务 该模块从元数据锁以及InnoDB锁两个维度分析当前业务锁状态。通过元数据锁视图与InnoDB锁拓扑图管理阻塞事务,协助用户优化自身业务,减少锁冲突。 管理锁&事务 慢SQL 提供指定时间段内的慢SQL分析功能。从用户、IP、SQL模板等进行多维统计,展示统计结果并支持指定排序,识别慢SQL的精准来源,方便用户快速优化业务。 查看慢SQL 全量SQL 在实例开启全量SQL的前提下,该模块基于全量SQL数据进行分析,并提供多维度的分析、搜索、过滤的能力,帮助用户全面洞察SQL,TOP SQL快速定位异常原因,保障数据库稳定运行。 查看TOP SQL 新增SQL洞察任务 SQL限流 针对新上业务不能及时发包优化的SQL和突发流量导致CPU等资源100%瓶颈的场景,SQL限流功能通过控制既定SQL规则的并发度协助业务侧及时流控,保证核心业务的稳定运行。 设置SQL限流规则 自治限流 该功能自动检测数据库的CPU利用率、活跃会话数等异常,根据业务优先级进行限流处理,保证核心业务的稳定运行。 用户可以根据业务情况,按照数据库或者用户进行限流。将非核心数据库或非核心用户业务配置为限流对象,可以保障核心业务不受影响。 配置自治限流 诊断日报 对前一日实例状态的汇总展示,包括以上部分模块的重点指标:慢SQL分析、全量SQL分析、性能与磁盘分析。支持用户下载和订阅分析报告。建议每天定时对实例进行诊断,以保证实例上业务的正常运转。 管理诊断日报 异常快照 智能判断实例异常,记录会话快照、锁/事务等快照信息,方便后续问题定位。 管理异常快照
  • 功能描述 智能DBA(Database Administrator,数据库管理员)功能主要面向开发人员和数据库管理人员,提供数据库运维和智能诊断的可视化界面,提升数据库的运维能力与易用性。通过告警统计、资源使用情况、健康智能诊断、性能指标数据、容量预估等维度分析,帮助用户快速定位故障,实时了解实例运行情况。 如果要在RDS界面使用智能DBA助手功能, IAM 子账号必须要有RDS FullAccess、DAS FullAccess、DAS Administrator、 CES FullAccess权限。如果需要添加权限,请参见创建用户并授权使用RDS。
  • 使用场景 紧急恢复实例场景中,通过设置慢会话阈值帮助用户快速识别异常会话并手动结束该会话,使得数据库恢复正常,提高数据库的可用性。 新业务中出现并发数过高的SQL语句导致实例不稳定场景中,通过设置SQL限流规则功能控制并发数过高的SQL语句,保证实例的稳定性。 出现“磁盘空间满”问题时,通过查看磁盘空间功能实时了解磁盘空间概况与分布。您可以设置存储空间自动扩容,在实例存储空间达到阈值时,会触发自动扩容,详见存储空间自动扩容。 在突发流量过高、异常读写等业务场景中,通过配置自治限流功能控制活跃连接数来保障核心业务访问的可用性。
  • 约束限制 正在执行操作的实例不能手动删除,只有在实例操作完成后,才可删除实例。 如果实例的备份文件正在执行数据恢复操作,该实例不允许删除。 实例停止后,不支持通过控制台删除实例。 “按需计费”类型的实例删除后将不再产生费用,实例生成的自动备份会被同步删除,保留的手动备份会继续收取费用。 删除主实例时,会同步删除其对应的备实例和只读实例,请您谨慎操作。 创建失败的实例不会收费。 实例删除后,资源立即释放,请谨慎操作。如需保留数据,请务必确认完成创建手动备份后再删除实例。 通过数据库回收站中重建实例功能,可以恢复1~7天内删除的实例。 通过保留的手动备份,可以恢复实例数据,具体请参见通过备份文件恢复RDS for PostgreSQL实例数据。
  • 备份原理 单机实例 采用单个数据库节点部署架构。与主流的主备实例相比,它只包含一个节点,但具有高性价比。备份触发后,从主库备份数据并以压缩包的形式存储在 对象存储服务 上,不会占用实例的磁盘空间。 主备实例 采用一主一备的经典高可用架构,主备实例的每个节点的规格保持一致。备份触发后,从主库备份数据并以压缩包的形式存储在对象存储服务上,不会占用实例的磁盘空间。 当数据库或表被恶意或误删除,虽然RDS支持HA高可用,但备机数据库会被同步删除且无法还原。因此,数据被删除后只能依赖于实例的备份保障数据安全。 图1 备份原理
  • 备份方案 表1供了常见的数据备份和下载备份文件的方法。 表1 备份方案 任务类型 备份类型 使用场景 同区域备份 自动备份 RDS会在数据库实例的备份时段中创建数据库实例的自动备份,自动备份为全量备份。系统根据您指定的备份保留期保存数据库实例的自动备份。如果需要,您可以将数据恢复到备份保留期中的任意时间点。 开启自动备份策略后,会自动触发一次全量备份,备份方式为物理备份。之后会按照策略中的备份时间段和备份周期进行全量备份。 手动备份 手动备份是由用户启动的数据库实例的全量备份,备份方式为物理备份。手动备份会一直保存,不会随着RDS实例的删除而释放,直到用户手动删除。 增量备份 增量备份即WAL备份,云数据库 RDS for PostgreSQL默认自动开启,系统自动每5分钟对上一次自动备份,或增量备份后更新的数据进行备份。 跨区域备份 跨区域备份 支持将备份文件存放到另一个区域存储,某一区域的实例故障后,可以在异地区域使用备份文件在异地恢复到新的RDS实例,用来恢复业务。 下载备份文件 下载全量备份文件 包含使用OBS Browser+下载、直接浏览器下载、按地址下载三种方式。 下载增量备份文件 支持下载单个增量备份文件。
  • 约束限制 如需变更存储类型,请联系客服申请。 仅支持升配操作,不支持反向降配。 支持超高IO云盘变更到极速SSD云盘,SSD云盘变更到极速SSD云盘。 磁盘变更后若主实例和只读的磁盘类型不一致,可能会影响数据同步速度,建议先变更只读,并最终保持只读实例和主实例磁盘类型一致。 变更磁盘时,磁盘性能可能会发生变化,请在业务低峰期进行磁盘变更,避免对高峰期业务造成影响。 变更磁盘可能需要数分钟乃至数小时,在某些情况下可能会更长,具体时间视磁盘变配时的吞吐量、存储空间大小以、原磁盘类型及变更后类型而定。
  • 限制条件 账户余额大于等于0元,才可恢复到新实例。新实例将作为用户新创建的实例进行收费。 RDS for PostgreSQL不支持将备份恢复到原实例,如有需要,请先将备份恢复到新实例,然后将该实例的IP修改为原实例的IP。 恢复到已有实例的限制: 如需恢复到已有实例,请提交工单联系客服人员开通权限。 如果目标数据库实例已被删除,则不可恢复到已有实例。 恢复到已有实例会导致实例数据被覆盖,且恢复过程中实例将不可用。 只可选择与原实例相同VPC,相同引擎,相同版本或高版本的实例。 请确保目标实例的存储空间大于或等于当前实例的存储空间,否则会导致任务下发失败。
  • 限制条件 账户余额大于等于0元,才可恢复到新实例。新实例将作为用户新创建的实例进行收费。 RDS for PostgreSQL不支持将备份恢复到原实例,如有需要,请先将备份恢复到新实例,然后将该实例的IP修改为原实例的IP。 恢复到已有实例的限制: 如需恢复到已有实例,请提交工单联系客服人员开通权限。 恢复到已有实例会导致实例数据被覆盖,且恢复过程中实例将不可用。 只可选择与原实例相同VPC,相同引擎,相同版本或高版本的实例。 请确保目标实例的存储空间大于或等于当前实例的存储空间,否则会导致任务下发失败。
  • 操作场景 云数据库RDS支持切换主备实例的数据同步方式,以满足不同业务需求。可选择“异步”或者“同步”两种方式。 异步(默认选择):应用向主库写入数据时,数据写入主库,不需要等待备库收到日志,主库就向应用返回响应。 优点:主库因为底层故障等原因故障时,可以立即进行主备切换,不阻塞写入操作,具有很高的可用性;同时,异步复制的开销很少,具有较高的性能。 缺点:某些极限场景下,主备有复制延迟,倒换后可能发生数据丢失。 同步:应用向主库写入数据时,需要等待备库收到日志(日志持久化到磁盘),主库才向应用返回响应。 优点:主备数据强一致,倒换后不会丢失数据。 缺点:备库或者主库发生故障(底层或其他原因),在故障恢复前,会阻塞写入操作,可用性较低;同时,同步复制的开销较大,性能较异步模式低。 对数据库在线时间要求较高的业务,建议选择“异步”模式。 对数据一致性要求极高且能容忍写入操作被阻塞的业务,建议选择“同步”模式。 写入操作指非SELECT操作,如DDL和DML等。
  • 操作场景 创建云数据库RDS实例时,系统默认开启自动备份策略,安全考虑,实例创建成功后不可关闭,您可根据业务需要设置自动备份策略,云数据库RDS服务按照您设置的自动备份策略对数据库进行备份。 云数据库RDS服务的备份操作是实例级的,而不是数据库级的。当数据库故障或数据损坏时,可以通过备份恢复数据库,从而保证数据可靠性。备份以压缩包的形式存储在对象存储服务上,以保证用户数据的机密性和持久性。由于开启备份会损耗数据库读写性能,建议您选择业务低峰时间段设置自动备份。 设置自动备份策略后,会按照策略中的备份时间段和备份周期进行全量备份。实例在执行备份时,按照策略中的保留天数进行存放,备份时长和实例的数据量有关。 在进行全量备份的同时系统每5分钟会自动生成增量备份,用户不需要设置。生成的增量备份可以用来将数据恢复到指定时间点。
  • 查看GC监控 在 APM 服务支持对GC进行监控指标,具体指标以及说明,参见表2。 图6 查看GC监控 表3 GC监控指标说明 指标集 指标 说明 GC统计信息 fullgc次数 采集周期内fullgc的次数 fullgc时间(ms) 采集周期内fullgc的时间 younggc次数 采集周期内younggc的次数 younggc时间(ms) 采集周期内younggc的时间 gc详情 gc类型 gc类型,分为major和minor两种 gc原因 发生gc的原因 次数 gc发生的次数 耗时(ms) gc消耗的时间 最大耗时(ms) 最慢一次gc消耗的时间 gc回收器 gc回收器的名称 最慢gc详情 最慢一次gc的详细信息 单击“次数”、“耗时”、“最大耗时”等列的蓝色字体数值,可以查看默认20分钟内该gc的趋势图。 选中某一个时间节点时,图表支持联动,展示该时间节点下各个指标的实际数值。 gc详情支持查看gc类型、gc原因、次数、耗时(ms)、最大耗时(ms)、gc回收器以及最慢gc详情(查看详情和历史信息)。
  • 查看线程 可以直接在APM服务页面查看对应实例的线程信息,参见表4。 图7 查看线程 表4 线程指标说明 指标集 指标 说明 线程详情 线程名称 线程名称 线程数量 线程数量 cpu耗时(ms) 线程cpu耗时 内存(M) 内存(M) 线程堆栈 线程堆栈 单击“个数”列的数值,可以查看所选时间段内该线程的趋势图。 单击“线程堆栈”列的“查看详情”,可以查看对应线程下线程详情。 单击“线程堆栈”列的“历史信息”,可以查看对应线程的线程堆栈信息。
  • 查看JVM监控 在APM服务支持对JVM进行监控指标,具体指标以及说明,参见表2。JVM进行监控指标以图表的形式展现在界面上,方便您对JVM监控数据更直观的查看与分析。选中某一个时间节点时,图表支持联动,展示该时间节点下各个指标的实际数值。 图5 查看JVM监控 表2 JVM监控指标说明 指标集 指标 说明 线程 当前线程数 当前线程数 死锁线程数 死锁线程数 守护线程数 守护线程数 所有启动线程数 所有已经启动的线程数 峰值线程数 峰值线程数 线程状态 WAITING状态线程数 等待状态线程数量 TERMINATED状态线程数 终止状态线程数量 RUNNABLE状态线程数 运行状态线程数量 BLOCKED状态线程数 阻塞状态线程数量 NEW状态线程数 新状态线程数量 TIMED_WAITING状态线程数 超时等待状态线程数量 内存 非堆内存的使用 非堆内存的使用大小 堆内存使用 堆内存使用的大小 直接内存使用 直接内存使用大小 类加载 已加载类数量 类加载器已加载类数量 总加载类数量 类加载器总加载类数量 卸载类数量 类加载器卸载类数量 内存池 可使用内存 当前可使用的内存大小 初始化内存 初始化内存大小 最大内存 最大内存大小 内存池名称 内存池名称 已使用内存 已经被使用的内存大小 CPU cpu使用率 java进程的cpu使用率
  • 查看JAVA方法 APM默认不对JAVA方法进行监控,如需进行监控需要先配置JavaMethod监控项。 配置完成后系统会对JAVA方法的方法、类进行监控。 在“基础监控”下选择对应的实例、选择“JAVA方法”,查看对应的监控详情,参见表5。 图8 查看JAVA方法 表5 JAVA方法指标说明 指标集 指标 说明 JAVA方法 类名 类名 方法名 方法名 调用次数 该方法的调用次数 平均响应时间(ms) 平均响应时间 错误数 该方法的错误数 最大并发 该方法的最大并发 最慢调用(ms) 该方法的最大响应时间 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数 100-500ms 响应时间在100-500ms范围请求数 500-1000ms 响应时间在500-1000ms范围请求数 1-10s 响应时间在1-10s范围请求数 10s以上 响应时间在10s以上请求数 单击“调用次数”、“错误数”等列的数值,可以查看所选时间段内该线程的趋势图。
  • 查看JVM信息 可以直接在JVM信息页面查看对应实例的JVM信息指标,具体指标以及说明,参见表1。 图4 查看JVM信息 表1 JVM信息指标说明 指标集 指标 说明 JVM信息 javaagent版本 java探针版本 启动时间 JVM启动时间 启动参数 JVM启动参数 java类库路径 java类库路径 java版本 java版本 java规范版本 java规范版本 操作系统 操作系统名称 操作系统版本 操作系统版本 arch cpu架构 处理器个数 处理器个数 SDK版本 sdk版本
  • 更多操作 您还可以执行表1中的操作。 表1 相关操作 操作 说明 选择“应用” 在页面左侧“应用”下拉菜单中,选择应用。 查看环境的拓扑 在应用列表中的“操作”列选择“拓扑”,可以查看环境的拓扑。 设置组件或环境 在应用列表中的“操作”列选择“设置”可以跳转到组件或环境的“实例”页签,可以对该组件或环境进行设置。 删除环境 在应用列表中的“操作”列选择“删除”,可删除所选环境。 搜索组件或环境 在右侧搜索提供组件、环境的检索功能,支持通过关键字、名称等方式快速检索资源。 返回旧版 在页面右上角,单击“返回旧版”,可以返回到APM 1.0版本。
  • 查看Hikari连接池监控 针对Hikari连接池监控系统会采集连接池详情、获取连接详情以及异常的相关信息,您可以单击列表右上角的自定义列表项,使界面上显示您需要查看的指标数据。具体指标以及说明,参见表6。 表6 Hikari连接池监控参数说明列表 指标集 指标 说明 连接池详情 连接地址 连接地址 驱动 驱动名称 最大允许连接数 最大允许连接数 当前总连接 当前总连接数 活跃连接数 活跃连接数 空闲连接数 空闲连接数 等待连接数 等待连接数 获取连接详情 连接地址 连接地址 调用次数 调用次数 总时间 总时间 平均响应时间(ms) 平均响应时间(ms) 错误次数 错误次数 最大并发 最大并发 最慢调用 最慢调用 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数 100-500ms 响应时间在100-500ms范围请求 500-1000ms 响应时间在500-1000ms范围请求数 1-10s 响应时间在1-10s范围请求数 10s以上 响应时间在10s以上请求数 异常 异常类 发生异常的类 异常类型 异常类型 数量 该异常的发生次数 异常消息 该异常产生的异常消息 错误堆栈 该异常产生的堆栈信息 单击“调用次数”、“平均响应时间”等列的蓝色字体数值,会以图表的形式显示对应的数值详情。
  • 查看Druid连接池监控 针对Druid连接池监控系统会采集数据源、获取连接详情、额外配置以及异常的相关信息,您可以单击列表右上角的自定义列表项,使界面上显示您需要查看的指标数据。具体指标以及说明,参见表5。 表5 Druid连接池监控参数说明列表 指标集 指标 说明 数据源 连接地址 连接地址 驱动 驱动名称 初始化连接数 初始化连接数 连接池最小空闲数 连接池最小空闲数 连接池最大空闲数 连接池最大空闲数 连接池最大连接量 最大池中连接数 空闲连接数 空闲连接数 最大空闲连接数 实际出现的最大空闲连接数 活跃连接数 活跃连接数 最大活跃连接数 实际出现的最大活跃连接数 等待线程数 等待线程数 最大等待线程数 最大等待线程数 等待线程数上限 等待线程数上限 获取连接总数 获取连接总数 获取连接详情 连接地址 连接地址 调用次数 调用次数 总时间 总时间 平均响应时间(ms) 平均响应时间(ms) 错误次数 错误次数 最大并发 最大并发 最慢调用 最慢调用 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数 100-500ms 响应时间在100-500ms范围请求 500-1000ms 响应时间在500-1000ms范围请求数 1-10s 响应时间在1-10s范围请求数 10s以上 响应时间在10s以上请求数 额外配置 连接地址 连接地址 获取连接最大等待时间 获取连接最大等待时间 获取连接检测 在连接池中取连接前校验连接是否有效 归还连接检测 当应用归还连接时是否校验连接是否有效 空闲连接检测 当应用向连接池申请连接且该连接被判断为空闲连接时,是否校验其有效性。 自动回收超时连接 是否自动回收超时连接 自动回收的超时时间 如果池中连接被获取且超过该时长未被还回,则回收该连接。 自动回收的超时连接数量 超时连接回收次数 最小空闲时间 池中连接可空闲的最小时间 连接有效性检测时间 检查池中连接空闲周期 异常 异常类 发生异常的类 异常类型 异常类型 数量 该异常的发生次数 异常消息 该异常产生的异常消息 错误堆栈 该异常产生的堆栈信息 版本 driver版本 驱动版本 单击“调用次数”、“平均响应时间”等列的蓝色字体数值,会以图表的形式显示对应的数值详情。 单击“驱动”、“driver版本”等列的蓝色字体描述,会先对应的描述详情。 图8 查看Druid连接池监控
  • 查看Mysql数据库监控 sql维度汇总 APM支持从sql维度对Mysql数据库进行监控,具体指标以及说明,参见表1。您可以单击列表右上角的自定义列表项,使界面上显示您需要查看的指标数据。 图4 sql维度汇总Mysql数据库监控 表1 sql维度汇总参数说明列表 指标集 指标 说明 sql监控 sql sql对应的唯一id,用于告警配置 sql语句 sql语句 调用次数 该sql的调用次数 平均响应时间(ms) 平均响应时间(ms) 错误次数 该sql的错误次数 读取行数 该sql的读取行数 更新行数 该sql的更新行数 最大并发 该sql的最大并发 最慢调用(ms) 该sql的最大响应时间 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数 100-200ms 响应时间在100-200ms范围请求数 200-1000ms 响应时间在200-1000ms范围请求数 1-10s 响应时间在1-10s范围请求数 10s以上 响应时间在10s以上请求数 最慢调用链 采集周期内最慢的调用链对应traceId 错误调用链 采集周期内发生错误的调用链对应traceId 单击“sql”列的sql语句可以查看sql语句详情。 单击“调用次数”、“平均响应时间”等列蓝色字体数值,会以图表的形式显示对应的数值详情。 单击“最慢调用链”或“错误调用链”列的某个最慢调用链或者错误调用链,系统会跳转到该调用链详情页面,查看该调用链的调用情况。 数据库维度汇总 APM支持以数据库维度汇总对Mysql数据库监控的指标,具体指标以及说明,参见表2。 图5 数据库维度汇总Mysql数据库监控 表2 数据库维度汇总参数说明列表 指标集 指标 说明 数据库连接 db 数据库名称 创建连接数 该数据库创建连接数 销毁连接数 该数据库销毁连接数 平均响应时间(ms) 平均响应时间(ms) 调用次数 该数据库的调用次数 错误次数 该数据库发生错误数 读取行数 该数据库读取行数 更新行数 该数据库更新行数 最慢调用(ms) 该数据库的最大响应时间 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数 100-200ms 响应时间在100-200ms范围请求数 200-1000ms 响应时间在200-1000ms范围请求数 1-10s 响应时间在1-10s范围请求数 10s以上 响应时间在10s以上请求数 单击“调用次数”、“平均响应时间”等列蓝色字体数值,会以图表的形式显示对应的数值详情。 异常 可以在异常页签下查看sql调用发送的异常统计信息,具体指标以及说明,参见表3。 表3 异常参数说明列表 指标集 指标 说明 异常 causeType 异常发生类 exceptionType 异常类型 次数 异常次数 异常sql 发生异常的sql 异常堆栈 异常产生的堆栈信息 消息 异常消息 总览 可以在总览页签下查看所选实例的调用趋势图,具体指标以及说明,参见表4。选中某一个时间节点时,图表支持联动。展示该时间节点下各个指标的实际数值。 图6 总览 表4 总览参数说明列表 指标集 指标 说明 总览 调用次数 总调用次数 读取行数 总读取行数 平均响应时间(ms) 平均响应时间(ms) 错误次数 总错误次数 更新行数 该数据库更新行数 信息 可以在信息页签下查看driver版本信息,单击蓝色driver版本信息,展示该版本详情。 图7 信息
  • 查看Profiler 在Profiler页签选择您想要查看的“实例名称”和“性能分析类型”,可以查看该实例对应的性能分析数据。 图2 查看Profiler 选择实例:在下拉列表中选择实例,当前最多可以同时选择2个实例。 选择性能分析类型:在下拉菜单中,选择性能分析类型。当前支持CPU Time、MEMORY、LATENCY三两种类型。 表2 性能分析类型说明 类型 说明 CPU Time 每个方法在CPU上的运行时间。 Memory 每个方法分配的堆内存大小。 Latency trace相关线程的方法执行的总耗时。包括方法在CPU上的运行时间、等待I/O的时间以及方法运行时发生的任何其他时间。 按照方法名搜索:搜索框设置搜索条件后,单击,查看满足搜索条件的实例列表。 单击时间维度选择按钮,默认“近20分钟”。 当前支持“近5分钟”、“近20分钟”、“近1小时”、“近3小时”、“近6小时”、“近1天”、“今天”、“昨天”以及自定义。 页面下方实时展示每一个方法、类和线程的调用关系和执行效率。 表3 Profiler参数说明 参数 说明 火焰图 火焰图Y轴(纵轴)表示调用栈,每一层都是一个函数(包),调用的越深,火焰层数越高,最底部(火焰尖)是正在执行的函数,上方是他的父函数。 火焰图X轴(横轴)表示占用时间(内存视图表示占用内存)长度,占用的cpu时间越长,其宽度越宽。 在火焰图中,相同的方法或包显示的颜色相同。 鼠标放在火焰图上,展示某一个方法、类和线程的详细信息。 单击火焰图中某个方法条,该方法条横向放大。单击“Total”列标题行,火焰图还原。 Location 方法路径。 鼠标放在Location类某个方法名称上,展示该方法的详细信息。 单击Location类某个方法名称,火焰图侧对应的方法会高亮显示,其余方法灰化。再次单击同一个方法名称,火焰图恢复原状。 Self 仅方法自身的性能消耗,不包含调用方法。该数值为所有线程执行结果的总和,因此结果有可能大于所选时间段。 Total 总性能消耗,包含方法自身及其调用方法。该数值为所有线程执行结果的总和,因此结果有可能大于所选时间段。
  • Agent启停 当Agent处于启动状态时,启停按钮显示为;当Agent处于停止状态时,启停按钮显示为。 停止Agent 在实例列表页面,单击需要停用Agent的实例所在行的启停按钮。 在弹出的“停用Agent”弹框单击“确定”,完成对所选实例的停止。 启动Agent 在实例列表页面,单击需要启动Agent的实例所在行的启停按钮。 在弹出的“启用Agent”弹框单击“确定”,完成对所选实例的启动。
  • 基本概念 账号 用户注册时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用该用户进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和IAM用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类应用或只面向特定租户提供应用服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability Zone) 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中创建资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 同样在我的凭证下,您可以查看项目ID。 企业项目 企业项目是项目的升级版,针对企业不同项目间资源的分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理用户指南》。 父主题: 使用前必读
  • API概览 应用性能管理 所提供的接口为扩展接口。通过使用应用性能管理所提供的接口,您可以完整的使用应用性能管理的所有功能。例如查询应用接口等。 应用性能管理提供的具体API如表1所示。 表1 APM API接口,接口说明 API接口 说明 应用列表 支持查询对应用户下的应用。 master地址 支持查询region下的master服务podlb地址信息。 获取ak/sk 支持查询用户创建的ak/sk列表。 环境列表 支持查询指定区域下的组件和环境及其探针情况进行搜索。 保存监控项 支持保存监控项配置。 监控项列表 支持查询监控项列表。 应用下所有探针 支持查询应用下所有探针情况。 更改实例的采集状态 支持改变指定实例的采集状态:开启和关闭。 删除agent 支持删除agent。 开通的region 支持查询用户开通的region信息。 所有的支持的region 支持查询所有的支持的region信息。 应用树 支持查询应用树。 环境标签 支持查询环境标签接口。 组件列表 支持查询组件列表。 组件下的环境列表 支持查询组件下的环境列表。 根据组件id删除指定的组件 支持删除指定的组件。 应用的详情 支持查询单个应用的详情。 子应用详情 支持查询单个子应用详情。 监控项配置信息 支持查询监控项配置信息。 调用链拓扑图 支持查询调用链拓扑图。 event详情 支持查询event的详情。 span数据 支持查询span数据查询接口。 调用链 支持查询一个TraceID的所有调用链数据。 趋势图 支持查询趋势图。 汇总表格数据 支持查询汇总表格数据。 原始数据表格 支持查询原始数据表格。 原始数据详情 支持查询原始数据详情。 实例信息列表 支持查询实例信息列表。 监控项信息 支持查询监控项信息。 创建aksk 支持自己创建aksk。 租户的aksk 支持查询租户的aksk。 删除aksk 支持删除已存在的aksk。 告警列表 支持查询已产生告警列表。 告警消息列表 支持查询已产生告警消息列表。 应用全局拓扑图 支持查询应用全局拓扑图。 组件环境拓扑图 支持查询组件环境拓扑图。 URL跟踪配置列表 支持查询已配置好的URL跟踪配置列表。 URL跟踪Region环境列表 支持查询所选Region下设置了URL跟踪的环境列表。 URL跟踪视图列表 支持查询当前被调用的URL跟踪视图列表。 URL跟踪视图详情 支持某条URL跟踪视图详情。 获取监控项详情 支持查询某个监控项的配置详情。
  • 支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:自定义策略中授权项定义的内容即为权限。 对应API接口:自定义策略实际调用的API接口。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM项目(Project)/企业项目(Enterprise Project):自定义策略的授权范围,包括IAM项目与企业项目。授权范围如果同时支持IAM项目和企业项目,表示此授权项对应的自定义策略,可以在IAM和企业管理两个服务中给用户组授权并生效。如果仅支持IAM项目,不支持企业项目,表示仅能在IAM中给用户组授权并生效,如果在企业管理中授权,则该自定义策略不生效。关于IAM项目与企业项目的区别,详情请参见IAM与企业管理的区别。 “√”表示支持,“x”表示暂不支持。 表1 API授权项列表 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 获取该用户创建的ak/sk列表 GET /v1/apm2/openapi/systemmng/get-ak-sk-list apm:apm2AkSk:read √ √ 查询对应用户下的应用 GET /v1/apm2/openapi/cmdb/business/get-business-list - √ √ 根据region名称获取该名称下的master服务podlb地址信息 GET /v1/apm2/openapi/systemmng/get-master-address - √ √
  • 请求消息体(可选) 该部分可选。请求消息体通常以结构化格式(如JSON或XML)发出,与请求消息头中Content-Type对应,传递除请求消息头之外的内容。若请求消息体中的参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类型的接口就不需要消息体,消息体具体内容需要根据具体接口而定。 对于获取用户Token接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示,加粗的斜体字段需要根据实际值填写,其中username为用户名,domainname为用户所属的账号名称,********为用户登录密码,xxxxxxxxxxxxxxxxxx为project的名称,如“cn-north-4”,您可以从地区和终端节点获取。 scope参数定义了Token的作用域,下面示例中获取的Token仅能访问project下的资源。您还可以设置Token的作用域为某个账号下所有资源或账号的某个project下的资源,详细定义请参见获取用户Token。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 POST https://apm2.cn-north-4.myhuaweicloud.com/v3/auth/tokens Content-Type: application/json { "auth": { "identity": { "methods": [ "password" ], "password": { "user": { "name": "username", "password": "********", "domain": { "name": "domainname" } } } }, "scope": { "project": { "name": "xxxxxxxxxxxxxxxxxx" } } } } 到这里为止这个请求需要的内容就具备齐全了,您可以使用curl、Postman或直接编写代码等方式发送请求调用API。对于获取用户Token接口,返回的响应消息头中“x-subject-token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。
  • 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表1。 表1 公共请求消息头 名称 描述 是否必选 示例 Host 请求的服务器信息,从服务API的URL中获取。值为hostname[:port]。端口缺省时使用默认的端口,https的默认端口为443。 否 使用AK/SK认证时该字段必选。 code.test.com or code.test.com:443 Content-Type 消息体的类型(格式)。推荐用户使用默认值application/json,有其他取值时会在具体接口中专门说明。 是 application/json Content-Length 请求body长度,单位为Byte。 否 3495 X-Project-Id project id,项目编号。 否 如果是专属云场景采用AK/SK认证方式的接口请求或者多project场景采用AK/SK认证的接口请求,则该字段必选。 e9993fc787d94b6c886cbaa340f9c0f4 X-Auth-Token 用户Token。 用户Token也就是调用获取用户Token接口的响应值,该接口是唯一不需要认证的接口。 请求响应成功后在响应消息头(Headers)中包含的“X-Subject-Token”的值即为Token值。 否 使用Token认证时该字段必选。 注:以下仅为Token示例片段。 MIIPAgYJKoZIhvcNAQcCo...ggg1BBIINPXsidG9rZ API同时支持使用AK/SK认证,AK/SK认证是使用SDK对请求进行签名,签名过程会自动往请求中添加Authorization(签名认证信息)和X-Sdk-Date(请求发送的时间)请求头。 AK/SK认证的详细说明请参见认证鉴权的“AK/SK认证”。 对于获取用户Token接口,由于不需要认证,所以只添加“Content-Type”即可,添加消息头后的请求如下所示。 1 2 POST https://apm2.cn-north-4.myhuaweicloud.com/v3/auth/tokens Content-Type: application/json
  • 请求方法 HTTP请求方法(也称为操作或动词),它告诉服务你正在请求什么类型的操作。 GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。 在“获取用户Token”的URI部分,您可以看到其请求方法为“POST”,则其请求为: 1 POST https://apm2.cn-north-4.myhuaweicloud.com/v3/auth/tokens
共100000条