云服务器内容精选

  • 测试模型 workload模型 表2 测试模型 测试模型编号 测试模型 workload-read-mostly(读多写少场景) 95% read, 5% update workload-read-write-combination(读写均衡场景) 50% update, 50% read workload-read-modify-write(读改写均衡场景) 50% read, 50% readmodifywrite workload-mixed-operational-analytical(读更新写混合场景) 65% read, 25% update, 10% insert workload-insert-mostly(写多读少场景) 90% insert, 10% read 数据模型 fieldlength=100, fieldcount=10 预置数据量 本次性能测试中,针对每种规格的实例,测试了如下预置数据量的性能。 预置数据具体如下表所示: 表3 预置数据量 编号 规格 预置数据量 cluster1 4U16GB 50GB cluster2 8U32GB 100GB cluster3 16U64GB 200GB cluster4 32U128GB 400GB
  • 测试环境 区域:华北-北京四 可用区:可用区1+可用区2+可用区3(跨3个可用区部署) 弹性云服务器(Elastic Cloud Server,简称E CS ):规格选择h3.4xlarge.2,16U32GB,操作系统镜像使用CentOS 7.5 64位版本。 被测试实例的配置:每个实例均包含3个节点。 被测试实例的规格:覆盖以下规格类型,详见表1 实例规格。 表1 实例规格 编号 规格 cluster1 4U16GB cluster2 8U32GB cluster3 16U64GB cluster4 32U128GB
  • 事件监控支持的事件说明 表1 云数据库 GeminiDB事件监控支持的事件说明 事件来源 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 NoSQL 创建实例业务失败 NoSQLCreateInstanceFailed 重要 一般是由于实例配额不足或底层资源不足等原因导致。 先释放不再使用的实例再尝试重新发放,或者提交工单调整配额上限。 无法创建数据库实例。 变更规格失败 NoSQLResizeInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试规格变更操作。 业务中断。 添加节点失败 NoSQLAddNodesFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,删除添加失败的节点,重新尝试添加新节点。 无 删除节点失败 NoSQLDeleteNodesFailed 重要 一般是由于底层释放资源失败导致。 重新尝试删除节点。 无 扩卷失败 NoSQLScaleUpStorageFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试扩卷操作。 如果磁盘满,会导致业务中断。 重置密码失败 NoSQLResetPasswordFailed 重要 一般是由于重置密码命令超时导致。 重新尝试重置密码操作。 无 修改参数模板失败 NoSQLUpdateInstanceParamGroupFailed 重要 一般是由于修改参数模板命令超时导致。 重新尝试修改参数模板操作。 无 设置备份策略失败 NoSQLSetBackupPolicyFailed 重要 一般是由于数据库连接异常导致。 重新重试设置备份策略操作。 无 创建手动备份失败 NoSQLCreateManualBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 创建自动备份失败 NoSQLCreateAutomatedBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 实例运行状态异常 NoSQLFaultyDBInstance 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 NoSQLDBInstanceRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 NoSQLFaultyDBNode 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 NoSQLDBNodeRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 实例主备切换 NoSQLPrimaryStandbySwitched 重要 在手动触发的主备倒换或节点故障自动触发的故障倒换场景下,会上报该事件。 不需要处理。 无 出现热点分区键 HotKeyOccurs 重要 客观上是因为主键设置不合理,使得热点数据集中分布在一个分区。客户端不合理的应用程序设计,造成对某一key的频繁读写。 1. 选择合理的分区键。 2. 业务增加缓存,业务应用先从缓存中读取热点数据。 影响业务请求成功率,存在影响集群性能及稳定性的风险。 出现超大分区键 BigKeyOccurs 重要 主键设计不合理,单个分区的记录数或数据量过大,引起了节点负载不均。 1. 选择合理的分区键 2. 基于现有分区键,增加分区键散列。 随着数据量增长,集群稳定性会下降。 数据盘空间不足 NoSQLRiskyDataDiskUsage 重要 数据盘空间不足,产生此告警。 请参见对应服务用户指南中“扩容磁盘”的内容,进行磁盘扩容。 实例被设为只读模式,数据无法写入。 数据盘空间已扩容并恢复可写 NoSQLDataDiskUsageRecovered 重要 数据盘空间已扩容并恢复可写,产生此事件。 无需处理。 无 创建索引失败 NoSQLCreateIndexFailed 重要 业务负载超过实例规格瓶颈,此时再创建索引会耗费更多实例资源,导致响应变慢甚至卡顿,最终超时,引起索引创建失败。 1、根据业务负载,选择匹配的实例规格 2、在业务低峰期创建索引 3、使用后台方式创建索引 4、索引字段,结合业务进行合理选择。 索引创建失败或不完整,导致索引无效,需要删掉索引重新创建。 发生写入降速 NoSQLStallingOccurs 重要 写入速度快,接近集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 发生写入停止 NoSQLStoppingOccurs 重要 写入速度过快,达到集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 重启数据库失败 NoSQLRestartDBFailed 重要 一般是由于实例状态异常等原因导致。 提交工单让运维处理。 数据库实例状态可能存在异常。 恢复到新实例失败 NoSQLRestoreToNewInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,重新尝试添加新节点。 无法恢复到新的数据库实例。 恢复到已有实例失败 NoSQLRestoreToExistInstanceFailed 重要 一般是由于备份文件下载或恢复失败等原因导致。 提交工单让运维处理。 当前数据库实例可能处于不可用状态。 删除备份文件失败 NoSQLDeleteBackupFailed 重要 一般是由于备份文件从obs删除失败导致。 重新尝试删除备份文件。 无 切换慢日志明文开关失败 NoSQLSwitchSlowlogPlainTextFailed 重要 一般是由于接口不支持切换等原因导致。 请查阅NoSQL用户指南,确认接口支持打开慢日志明文开关。提交工单让运维处理。 无 绑定EIP失败 NoSQLBindEipFailed 重要 一般是由于节点状态不正常,节点已经绑定EIP或EIP非法等原因导致。 检查节点是否正常,EIP是否合法。 无法通过公网访问数据库实例。 解绑EIP失败 NoSQLUnbindEipFailed 重要 一般是由于节点状态不正常,节点已经未绑定EIP等原因导致。 检查节点和EIP状态是否正常。 无 修改参数失败 NoSQLModifyParameterFailed 重要 一般是由于参数取值非法等原因导致。 排查参数值是否符合在合法范围内,提交工单让运维处理。 无 参数模板应用失败 NoSQLApplyParameterGroupFailed 重要 一般是由于实例状态异常导致参数模板无法应用等原因导致。 提交工单让运维处理。 无 开启或关闭SSL失败 NoSQLSwitchSSLFailed 重要 一般是由于修改SSL命令超时导致。 重新提交一次或者提交工单处理,并先保持切换之前使用SSL的连接方式。 是否使用SSL连接。 单行数据量太大 LargeRowOccurs 重要 用户单行数据量过大,可能会导致查询超时,进而节点OOM异常等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 父主题: 事件监控
  • 测试数据 不同测试模型下,不同规格且预置相当数据量,测试的OPS*数据(表格中黑色字体),详见表1 测试数据中加粗内容。 表1 测试数据 节点规格 4U16GB 8U32GB 16U64GB 32U128GB 客户端并发数 32 64 128 256 预置数据量 50GB 100GB 200GB 400GB 测试模型编号 读多写少场景 15627 44612 90713 169037 读写均衡场景 19565 46240 95065 158793 读改写均衡场景 11768 29488 59332 96964 读更新写混合场景 17534 40214 80661 137616 写多读少场景 23830 44548 67290 111540 OPS:Operation Per Second,数据库每秒执行的操作数。 测试模型编号:测试模型编号对应的测试模型,请参见表2 测试模型。 父主题: 性能白皮书
  • GeminiDB Mongo内核版本发布说明 本章节介绍GeminiDB Mongo的内核版本更新说明。 表1 GeminiDB Mongo版本说明 版本 日期 特性描述 4.0 2023-09-30 新特性及性能优化: 新增数据库死锁告警,当数据库死锁时上报告警,及时发现并规避问题。 问题修复: 修复只读状态下,可执行Distict命令的问题。 2023-07-30 新特性及性能优化: 支持设置“只写”状态,禁止特定读命令执行。 支持主节点被动触发Compaction时,同步到备节点执行该Compaction,避免备节点因磁盘占满与主节点脱节。 2023-06-30 新特性及性能优化: 支持客户端断开时,自动Kill该客户端关联的执行中的op,避免无效op占用系统资源。 优化TTL、删除操作等产生大量脏数据场景下的Compaction策略,使系统更加稳健。 添加配置参数,支持启动时触发全量Compaction,加速实例在大量脏数据场景下的启动速度。 2023-04-30 新特性及性能优化: 新增检测到磁盘故障时,会自动主备倒换,使数据库更加稳定地运行。 问题修复: 修复SERVER-37686漏洞。 2023-01-30 新特性及性能优化: 新增接口,在删除数据后,可主动释放存储空间。 父主题: 版本发布说明
  • GeminiDB Influx内核版本发布说明 本章节介绍GeminiDB Influx的内核版本更新说明。 表1 GeminiDB Influx版本说明 版本 日期 特性描述 1.7 2023-06-30 新特性及性能优化: 单节点实例支持选购冷存储,通过极简配置实现冷热数据分离,从而降低存储成本。 当单节点实例申请的冷存储空间不能满足业务需求时,支持扩容冷存储。 事件监控提供了事件类型数据上报、查询和告警的功能。 2023-04-30 新特性及性能优化: 云数据库 GeminiDB管理控制台购买InfluxDB单节点的数据库实例。 2023-03-30 新特性及性能优化: 支持操作系统更新,以提高数据库性能和数据库的整体安全状况。 2022-01-30 新特性及性能优化: 支持批量续费、退订、按需计费转包年/包月、包年/包月转按需计费操作。 2021-07-30 新特性及性能优化: 支持选购冷存储,通过极简配置实现冷热数据分离,从而降低存储成本。 当实例申请的冷存储空间不能满足业务需求时,支持扩容冷存储。 2021-06-30 新特性及性能优化: 购买集群实例时,实例名称支持中文。 支持修改安全组。 2021-04-30 新特性及性能优化: 支持数据备份和恢复,以保证数据可靠性。 2021-01-30 新特性及性能优化: 支持通过实例操作列执行规格变更、添加节点和磁盘扩容操作。 2020-11-30 新特性及性能优化: 支持实例添加节点,满足业务需求。 支持修改用户创建的数据库参数模板中的参数值,确保数据库实例发挥出最优性能。 2020-10-30 新特性及性能优化: 扩容磁盘支持每次至少选择1GB扩容量。 2020-09-30 新特性及性能优化: 如果资源配额限制无法满足使用需要时,支持申请扩大配额。 根据可能需要支持重启数据库实例。 2020-08-30 新特性及性能优化: 以方便区分和识别实例,支持修改数据库实例名称。 支持将删除的实例,加入回收站管理,可以在回收站中重建实例恢复数据。 支持包周期计费模式。 支持查看实例的各项监控指标。 2020-07-30 新特性及性能优化: 支持通过公网方式连接实例。 支持跨AZ级容灾。 父主题: 版本发布说明
  • GeminiDB Influx各版本的生命周期规划 EOM:End of Marketing,停止该版本的销售。 EOS:End of Service & support,停止该版本的服务,建议您在执行作业时选择最新版本的引擎。在该日期之后,不再提供该软件版本的任何技术服务支持。 表1 GeminiDB Influx各版本生命周期规划表 版本 当前状态 华为云商用时间 计划EOM时间 计划EOS时间 1.7 已商用 2020年1月 暂无计划 持续运营 1.8 已商用 2023年7月 暂无计划 持续运营
  • 响应示例 状态码: 200 Success { "instances" : [ { "id" : "8436a91546294036b75931e879882200in06", "name" : "nosql-efa6", "status" : "normal", "port" : "8635", "mode" : "Cluster", "region" : "aaa", "datastore" : { "type" : "Cassandra", "version" : "3.11", "whole_version" : "3.11.3.11204", "patch_available" : false }, "engine" : "rocksDB", "created" : "2019-01-17T07:05:52", "updated" : "2019-01-17T07:05:47", "db_user_name" : "rwuser", "vpc_id" : "674e9b42-cd8d-4d25-a2e6-5abcc565b961", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "security_group_id" : "7aa51dbf-5b63-40db-9724-dad3c4828b58", "backup_strategy" : { "start_time" : "16:00-17:00", "keep_days" : 7 }, "pay_mode" : 0, "maintenance_window" : "02:00-06:00", "groups" : [ { "id" : "0b0ff12541794e1084f6827e424be2d6gr06", "status" : "creating", "volume" : { "size" : 10, "used" : 0.33 }, "nodes" : [ { "id" : "233eaac9c6f245c0bb9c2d21eea12d1bno06", "name" : "nosql-efa6_priam_node_1", "status" : "normal", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "private_ip" : "192.168.0.174", "spec_code" : "geminidb.redis.xlarge.4", "availability_zone" : "bbb" }, { "id" : "d57d76d6320a4a7b86db82c317550c4ano06", "name" : "nosql-efa6_priam_node_2", "status" : "normal", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "private_ip" : "192.168.0.175", "spec_code" : "geminidb.redis.xlarge.4", "availability_zone" : "bbb" }, { "id" : "f46b0a1cf4d9400e9fd7af17f8742d37no06", "name" : "nosql-efa6_priam_node_3", "status" : "normal", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "private_ip" : "192.168.0.176", "spec_code" : "geminidb.redis.xlarge.4", "availability_zone" : "bbb" } ] } ], "enterprise_project_id" : "0", "availability_zone": "cn-north-4a,cn-north-4b,cn-north-4c", "time_zone" : "", "actions" : [ "CREATE" ], "lb_ip_address" : "192.168.11.145", "lb_port" : "8635" }, { "id" : "1236a91546294036b75931e879882200in02", "name" : "nosql-efa7", "status" : "normal", "port" : "8635", "mode" : "ReplicaSet", "region" : "aaa", "datastore" : { "type" : "ReplicaSet", "version" : "4.0", "patch_available" : false }, "engine" : "rocksDB", "created" : "2019-01-17T07:05:52", "updated" : "2019-01-17T07:05:47", "db_user_name" : "rwuser", "vpc_id" : "674e9b42-cd8d-4d25-a2e6-5abcc565b961", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "security_group_id" : "7aa51dbf-5b63-40db-9724-dad3c4828b58", "backup_strategy" : { "start_time" : "16:00-17:00", "keep_days" : 7 }, "pay_mode" : 0, "maintenance_window" : "02:00-06:00", "groups" : [ { "id" : "0b0ff12541794e1084f6827e424be2d1gr02", "status" : "normal", "volume" : { "size" : 100, "used" : 0.003 }, "nodes" : [ { "id" : "233eaac9c6f245c0bb9c2d21eea12d1bno02", "name" : "nosql-efa7_replica_node_2", "status" : "normal", "role" : "Primary", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "private_ip" : "192.168.0.174", "public_ip" : "10.154.217.134", "spec_code" : "geminidb.mongodb.xlarge.4", "availability_zone" : "bbb" }, { "id" : "d57d76d6320a4a7b86db82c317550c4ano02", "name" : "nosql-efa7_replica_node_1", "status" : "normal", "role" : "Secondary", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "private_ip" : "192.168.0.39", "spec_code" : "geminidb.mongodb.xlarge.4", "availability_zone" : "bbb" }, { "id" : "f46b0a1cf4d9400e9fd7af17f8742d37no02", "name" : "nosql-efa7_replica_node_3", "status" : "normal", "role" : "Secondary", "subnet_id" : "f1df08c5-71d1-406a-aff0-de435a51007b", "private_ip" : "192.168.0.176", "spec_code" : "geminidb.mongodb.xlarge.4", "availability_zone" : "bbb" } ] } ], "enterprise_project_id" : "0", "availability_zone": "cn-north-4a,cn-north-4b,cn-north-4c", "time_zone" : "", "actions" : [ ] } ], "total_count" : 2 }
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 instances Array of ListInstancesResult objects 实例信息。 total_count Integer 总记录数。 表5 ListInstancesResult 参数 参数类型 描述 id String 实例ID。 name String 实例名称。 status String 实例状态。 取值: normal,表示实例正常。 abnormal,表示实例异常。 creating,表示实例创建中。 frozen,表示实例被冻结。 data_disk_full,表示实例磁盘已满。 createfail,表示实例创建失败。 enlargefail,表示实例扩容节点个数失败。 port String 数据库端口。 mode String 实例类型。与请求参数相同。 region String 实例所在区域。 datastore ListInstancesDatastoreResult object 数据库信息。 engine String 存储引擎。 取值为“rocksDB”。 created String 实例创建时间。 updated String 实例操作最新变更的时间。 db_user_name String 默认用户名。取值为“rwuser”。 vpc_id String 虚拟私有云ID。 subnet_id String 子网ID。 GeminiDB Cassandra 实例使用多个子网的场景,请参见表 ListInstancesNodeResult字段数据结构说明中的“subnet_id”。 security_group_id String 安全组ID。 backup_strategy ListInstancesBackupStrategyResult object 备份策略。 pay_mode String 计费方式。 取值为“0”,表示按需计费。 取值为“1”,表示包年/包月计费。 maintenance_window String 系统可维护时间窗。 groups Array of ListInstancesGroupResult objects 组信息。 enterprise_project_id String 企业项目ID。 取值为“0”,表示为default企业项目。 time_zone String 时区。 actions Array of strings 实例正在执行的动作。示例: CREATE REBOOT RESTORE dedicated_resource_id String 专属资源ID,只有数据库实例属于专属资源池才会返回该参数。 lb_ip_address String 负载均衡IP,只有存在负载均衡IP,才会返回该参数。 lb_port String 负载均衡端口,只有存在负载均衡IP,才会返回该参数。 availability_zone String 可用区。 表6 ListInstancesDatastoreResult 参数 参数类型 描述 type String 数据库接口。 version String 数据库版本号。 patch_available Boolean 当前实例是否有可升级的补丁,返回true时可以通过“数据库补丁升级”进行升级。 whole_version String 数据库的完整版本号(目前只有GeminiDB Cassandra支持)。 表7 ListInstancesBackupStrategyResult 参数 参数类型 描述 start_time String 备份时间段。自动备份将在该时间段内触发。当前时间指UTC时间。 keep_days Integer 已生成备份文件可以保存的天数。取值范围:0~35。 表8 ListInstancesGroupResult 参数 参数类型 描述 id String 组ID。 status String 组状态。 取值: normal,表示组正常。 abnormal,表示组异常。 creating,表示组创建中。 createfail,表示组创建失败。 deleted,表示组被删除。 resizefailed,表示组规格变更失败。 enlargefail,表示组扩容失败。 volume Volume object volume信息 nodes Array of ListInstancesNodeResult objects 节点信息。 表9 Volume 参数 参数类型 描述 size String 磁盘大小。单位:GB。 used String 磁盘使用量。单位:GB。 表10 ListInstancesNodeResult 参数 参数类型 描述 id String 节点ID。 name String 节点名称。 status String 节点状态。 取值: normal,表示节点正常。 abnormal,表示节点异常。 creating,表示节点创建中。 createfail,表示节点创建失败。 deleted,表示节点被删除。 resizefailed,表示节点规格变更失败。 enlargefail,表示节点扩容失败。 role String 节点角色。 该参数仅对GeminiDB Mongo接口的副本集实例有效。 subnet_id String 节点所在的子网的ID。 private_ip String 节点内网IP。在弹性云服务器创建成功后参数值存在,否则,值为""。 public_ip String 绑定的公网IP。该参数仅针对绑定了公网IP的节点有效。 spec_code String 资源规格编码。关于实例的规格信息,请参见查询数据库规格中响应参数“flavors.spec_code”的值。 availability_zone String 可用区。 support_reduce Boolean 是否支持节点缩容。 true,表示该节点支持节点缩容。 false,表示该节点不支持节点缩容。
  • 请求示例 URI样例 查询所有实例列表和详情 GET https://gaussdb-nosql.cn-north-4.myhuaweicloud.com/v3/0483b6b16e954cb88930a360d2c4e663/instances URI样例 根据指定条件查询实例列表和详情 GET https://gaussdb-nosql.cn-north-4.myhuaweicloud.com/v3/0483b6b16e954cb88930a360d2c4e663/instances?offset=0&limit=10&id=ed7cc6166ec24360a5ed5c5c9c2ed726in06&name=hy&mode=Cluster&datastore_type=cassandra&vpc_id=19e5d45d-70fd-4a91-87e9-b27e71c9891f&subnet_id=bd51fb45-2dcb-4296-8783-8623bfe89bb7
  • URI GET https://{Endpoint}/v3/{project_id}/instances 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户在某一region下的project ID。获取方法请参见获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 id 否 String 实例ID。 如果id以“*”起始,表示按照“*”后面的值模糊匹配,否则,按照实际填写的id精确匹配查询。 name 否 String 实例名称。 如果name以“*”起始,表示按照“*”后面的值模糊匹配,否则,按照实际填写的name精确匹配查询。 说明: 如果实例名称中包含中文,暂时不支持通过中文模糊搜索。 datastore_type 否 String 数据库类型。 取值为“cassandra”,表示查询GeminiDB Cassandra数据库实例。 取值为“mongodb”,表示GeminiDB Mongo查询数据库实例。 取值为“influxdb”,表示查询GeminiDB Influx数据库实例。 取值为“redis”,表示查询GeminiDB Redis数据库实例。 如果不传该参数,表示查询所有数据库实例。 mode 否 String 实例类型。 取值为“Cluster”,表示GeminiDB Cassandra、GeminiDB Influx、GeminiDB Redis集群实例类型。 取值为“InfluxdbSingle”,表示GeminiDB Influx单节点实例类型。 取值为“ReplicaSet”,表示GeminiDB Mongo副本集实例类型。 如果不传datastore_type参数,自动忽略该参数设置。 vpc_id 否 String 虚拟私有云ID,获取方法如下: 方法1:登录虚拟私有云服务的控制台界面,在虚拟私有云的详情页面查找VPC ID。 方法2:通过虚拟私有云服务的API接口查询,具体操作可参考查询VPC列表。 subnet_id 否 String 子网的网络ID,获取方法如下: 方法1:登录虚拟私有云服务的控制台界面,单击VPC下的子网,进入子网详情页面,查找网络ID。 方法2:通过虚拟私有云服务的API接口查询,具体操作可参考查询子网列表。 offset 否 Integer 索引位置偏移量,表示从指定project ID下最新的实例创建时间开始,按时间的先后顺序偏移offset条数据后查询对应的实例信息。 取值大于或等于0。不传该参数时,查询偏移量默认为0,表示从最新的实例创建时间对应的实例开始查询。 limit 否 Integer 查询实例个数上限值。 取值范围:1~100。不传该参数时,默认查询前100条实例信息。
  • 事件监控支持的事件说明 表1 云数据库 GeminiDB事件监控支持的事件说明 事件来源 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 NoSQL 创建实例业务失败 NoSQLCreateInstanceFailed 重要 一般是由于实例配额不足或底层资源不足等原因导致。 先释放不再使用的实例再尝试重新发放,或者提交工单调整配额上限。 无法创建数据库实例。 变更规格失败 NoSQLResizeInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试规格变更操作。 业务中断。 添加节点失败 NoSQLAddNodesFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,删除添加失败的节点,重新尝试添加新节点。 无 删除节点失败 NoSQLDeleteNodesFailed 重要 一般是由于底层释放资源失败导致。 重新尝试删除节点。 无 扩卷失败 NoSQLScaleUpStorageFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试扩卷操作。 如果磁盘满,会导致业务中断。 重置密码失败 NoSQLResetPasswordFailed 重要 一般是由于重置密码命令超时导致。 重新尝试重置密码操作。 无 修改参数模板失败 NoSQLUpdateInstanceParamGroupFailed 重要 一般是由于修改参数模板命令超时导致。 重新尝试修改参数模板操作。 无 设置备份策略失败 NoSQLSetBackupPolicyFailed 重要 一般是由于数据库连接异常导致。 重新重试设置备份策略操作。 无 创建手动备份失败 NoSQLCreateManualBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 创建自动备份失败 NoSQLCreateAutomatedBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 实例运行状态异常 NoSQLFaultyDBInstance 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 NoSQLDBInstanceRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 NoSQLFaultyDBNode 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 NoSQLDBNodeRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 实例主备切换 NoSQLPrimaryStandbySwitched 重要 在手动触发的主备倒换或节点故障自动触发的故障倒换场景下,会上报该事件。 不需要处理。 无 出现热点分区键 HotKeyOccurs 重要 客观上是因为主键设置不合理,使得热点数据集中分布在一个分区。客户端不合理的应用程序设计,造成对某一key的频繁读写。 1. 选择合理的分区键。 2. 业务增加缓存,业务应用先从缓存中读取热点数据。 影响业务请求成功率,存在影响集群性能及稳定性的风险。 出现超大分区键 BigKeyOccurs 重要 主键设计不合理,单个分区的记录数或数据量过大,引起了节点负载不均。 1. 选择合理的分区键 2. 基于现有分区键,增加分区键散列。 随着数据量增长,集群稳定性会下降。 数据盘空间不足 NoSQLRiskyDataDiskUsage 重要 数据盘空间不足,产生此告警。 请参见对应服务用户指南中“扩容磁盘”的内容,进行磁盘扩容。 实例被设为只读模式,数据无法写入。 数据盘空间已扩容并恢复可写 NoSQLDataDiskUsageRecovered 重要 数据盘空间已扩容并恢复可写,产生此事件。 无需处理。 无 创建索引失败 NoSQLCreateIndexFailed 重要 业务负载超过实例规格瓶颈,此时再创建索引会耗费更多实例资源,导致响应变慢甚至卡顿,最终超时,引起索引创建失败。 1、根据业务负载,选择匹配的实例规格 2、在业务低峰期创建索引 3、使用后台方式创建索引 4、索引字段,结合业务进行合理选择。 索引创建失败或不完整,导致索引无效,需要删掉索引重新创建。 发生写入降速 NoSQLStallingOccurs 重要 写入速度快,接近集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 发生写入停止 NoSQLStoppingOccurs 重要 写入速度过快,达到集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 重启数据库失败 NoSQLRestartDBFailed 重要 一般是由于实例状态异常等原因导致。 提交工单让运维处理。 数据库实例状态可能存在异常。 恢复到新实例失败 NoSQLRestoreToNewInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,重新尝试添加新节点。 无法恢复到新的数据库实例。 恢复到已有实例失败 NoSQLRestoreToExistInstanceFailed 重要 一般是由于备份文件下载或恢复失败等原因导致。 提交工单让运维处理。 当前数据库实例可能处于不可用状态。 删除备份文件失败 NoSQLDeleteBackupFailed 重要 一般是由于备份文件从obs删除失败导致。 重新尝试删除备份文件。 无 切换慢日志明文开关失败 NoSQLSwitchSlowlogPlainTextFailed 重要 一般是由于接口不支持切换等原因导致。 请查阅NoSQL用户指南,确认接口支持打开慢日志明文开关。提交工单让运维处理。 无 绑定EIP失败 NoSQLBindEipFailed 重要 一般是由于节点状态不正常,节点已经绑定EIP或EIP非法等原因导致。 检查节点是否正常,EIP是否合法。 无法通过公网访问数据库实例。 解绑EIP失败 NoSQLUnbindEipFailed 重要 一般是由于节点状态不正常,节点已经未绑定EIP等原因导致。 检查节点和EIP状态是否正常。 无 修改参数失败 NoSQLModifyParameterFailed 重要 一般是由于参数取值非法等原因导致。 排查参数值是否符合在合法范围内,提交工单让运维处理。 无 参数模板应用失败 NoSQLApplyParameterGroupFailed 重要 一般是由于实例状态异常导致参数模板无法应用等原因导致。 提交工单让运维处理。 无 开启或关闭SSL失败 NoSQLSwitchSSLFailed 重要 一般是由于修改SSL命令超时导致。 重新提交一次或者提交工单处理,并先保持切换之前使用SSL的连接方式。 是否使用SSL连接。 单行数据量太大 LargeRowOccurs 重要 用户单行数据量过大,可能会导致查询超时,进而节点OOM异常等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 父主题: 事件监控
  • 基本概念 账号 用户的账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用其进行日常管理工作。 用户 由账号在 IAM 中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域 指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。 可用区 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 企业项目 企业项目是项目的升级版,针对企业不同项目间资源的分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理服务用户指南》。 父主题: 使用前必读
  • 事件监控支持的事件说明 表1 云数据库 GeminiDB事件监控支持的事件说明 事件来源 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 NoSQL 创建实例业务失败 NoSQLCreateInstanceFailed 重要 一般是由于实例配额不足或底层资源不足等原因导致。 先释放不再使用的实例再尝试重新发放,或者提交工单调整配额上限。 无法创建数据库实例。 变更规格失败 NoSQLResizeInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试规格变更操作。 业务中断。 添加节点失败 NoSQLAddNodesFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,删除添加失败的节点,重新尝试添加新节点。 无 删除节点失败 NoSQLDeleteNodesFailed 重要 一般是由于底层释放资源失败导致。 重新尝试删除节点。 无 扩卷失败 NoSQLScaleUpStorageFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试扩卷操作。 如果磁盘满,会导致业务中断。 重置密码失败 NoSQLResetPasswordFailed 重要 一般是由于重置密码命令超时导致。 重新尝试重置密码操作。 无 修改参数模板失败 NoSQLUpdateInstanceParamGroupFailed 重要 一般是由于修改参数模板命令超时导致。 重新尝试修改参数模板操作。 无 设置备份策略失败 NoSQLSetBackupPolicyFailed 重要 一般是由于数据库连接异常导致。 重新重试设置备份策略操作。 无 创建手动备份失败 NoSQLCreateManualBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 创建自动备份失败 NoSQLCreateAutomatedBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 实例运行状态异常 NoSQLFaultyDBInstance 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 NoSQLDBInstanceRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 NoSQLFaultyDBNode 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 NoSQLDBNodeRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 实例主备切换 NoSQLPrimaryStandbySwitched 重要 在手动触发的主备倒换或节点故障自动触发的故障倒换场景下,会上报该事件。 不需要处理。 无 出现热点分区键 HotKeyOccurs 重要 客观上是因为主键设置不合理,使得热点数据集中分布在一个分区。客户端不合理的应用程序设计,造成对某一key的频繁读写。 1. 选择合理的分区键。 2. 业务增加缓存,业务应用先从缓存中读取热点数据。 影响业务请求成功率,存在影响集群性能及稳定性的风险。 出现超大分区键 BigKeyOccurs 重要 主键设计不合理,单个分区的记录数或数据量过大,引起了节点负载不均。 1. 选择合理的分区键 2. 基于现有分区键,增加分区键散列。 随着数据量增长,集群稳定性会下降。 数据盘空间不足 NoSQLRiskyDataDiskUsage 重要 数据盘空间不足,产生此告警。 请参见对应服务用户指南中“扩容磁盘”的内容,进行磁盘扩容。 实例被设为只读模式,数据无法写入。 数据盘空间已扩容并恢复可写 NoSQLDataDiskUsageRecovered 重要 数据盘空间已扩容并恢复可写,产生此事件。 无需处理。 无 创建索引失败 NoSQLCreateIndexFailed 重要 业务负载超过实例规格瓶颈,此时再创建索引会耗费更多实例资源,导致响应变慢甚至卡顿,最终超时,引起索引创建失败。 1、根据业务负载,选择匹配的实例规格 2、在业务低峰期创建索引 3、使用后台方式创建索引 4、索引字段,结合业务进行合理选择。 索引创建失败或不完整,导致索引无效,需要删掉索引重新创建。 发生写入降速 NoSQLStallingOccurs 重要 写入速度快,接近集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 发生写入停止 NoSQLStoppingOccurs 重要 写入速度过快,达到集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 重启数据库失败 NoSQLRestartDBFailed 重要 一般是由于实例状态异常等原因导致。 提交工单让运维处理。 数据库实例状态可能存在异常。 恢复到新实例失败 NoSQLRestoreToNewInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,重新尝试添加新节点。 无法恢复到新的数据库实例。 恢复到已有实例失败 NoSQLRestoreToExistInstanceFailed 重要 一般是由于备份文件下载或恢复失败等原因导致。 提交工单让运维处理。 当前数据库实例可能处于不可用状态。 删除备份文件失败 NoSQLDeleteBackupFailed 重要 一般是由于备份文件从obs删除失败导致。 重新尝试删除备份文件。 无 切换慢日志明文开关失败 NoSQLSwitchSlowlogPlainTextFailed 重要 一般是由于接口不支持切换等原因导致。 请查阅NoSQL用户指南,确认接口支持打开慢日志明文开关。提交工单让运维处理。 无 绑定EIP失败 NoSQLBindEipFailed 重要 一般是由于节点状态不正常,节点已经绑定EIP或EIP非法等原因导致。 检查节点是否正常,EIP是否合法。 无法通过公网访问数据库实例。 解绑EIP失败 NoSQLUnbindEipFailed 重要 一般是由于节点状态不正常,节点已经未绑定EIP等原因导致。 检查节点和EIP状态是否正常。 无 修改参数失败 NoSQLModifyParameterFailed 重要 一般是由于参数取值非法等原因导致。 排查参数值是否符合在合法范围内,提交工单让运维处理。 无 参数模板应用失败 NoSQLApplyParameterGroupFailed 重要 一般是由于实例状态异常导致参数模板无法应用等原因导致。 提交工单让运维处理。 无 开启或关闭SSL失败 NoSQLSwitchSSLFailed 重要 一般是由于修改SSL命令超时导致。 重新提交一次或者提交工单处理,并先保持切换之前使用SSL的连接方式。 是否使用SSL连接。 单行数据量太大 LargeRowOccurs 重要 用户单行数据量过大,可能会导致查询超时,进而节点OOM异常等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 父主题: 附录
  • API概览 云数据库 GeminiDB所提供的接口为扩展接口。通过使用云数据库 GeminiDB接口,您可以使用云数据库 GeminiDB的部分功能,具体如下表所示。 表1 接口说明 类型 描述 查询API版本 查询API版本列表 查询API版本信息 查询数据库版本信息 查询指定实例类型的数据库版本信息。 查询所有实例规格信息 查询指定条件下的所有实例规格信息。 实例管理 包括创建实例、删除实例、查询实例列表、扩容实例存储容量、扩容集群实例的节点数量、缩容集群实例的节点数量、变更实例规格、修改实例管理员密码、修改实例名称和变更实例安全组接口。 备份和恢复 包括查询自动备份策略、设置自动备份策略接口。 参数管理 包括获取参数模板列表、创建参数模板、修改参数模板的参数、应用参数模板、修改指定实例的参数、获取指定实例的参数、获取指定参数模板的参数、删除参数模板接口。 账号管理 包括创建数据库账号、修改数据库账号权限、修改数据库账号密码、删除数据库账号、获取数据库账号列表和详情、获取实例数据库列表。 标签管理 包括查询资源实例、批量添加或删除资源标签、查询资源标签接口。 日志管理 包括查询数据库慢日志接口。 配额管理 包括查询配额 容灾管理 包括校验实例是否可以与指定实例建立/解除容灾关系、搭建实例与特定实例的容灾关系、解除实例与指定实例的容灾关系。