华为云用户手册

  • GS_ROW_TABLE_IO_STAT GS_ROW_TABLE_IO_STAT视图显示当前数据库中所有行存表在当前节点上的IO情况。各统计字段为实例启动以来的累计值。 表1 GS_ROW_TABLE_IO_STAT字段 名称 类型 描述 schemaname name 表的命名空间 relname name 表的名称 heap_read bigint 堆逻辑读块数 heap_hit bigint 堆命中块数 idx_read bigint 索引逻辑读块数 idx_hit bigint 索引命中块数 toast_read bigint TOAST表逻辑读块数 toast_hit bigint TOAST表命中块数 tidx_read bigint TOAST表Index逻辑读个数 tidx_hit bigint TOAST表Index命中个数 父主题: 系统视图
  • 术语表 术语 解释 A – E ACID 在可靠数据库管理系统(DBMS)中,事务(transaction)所应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、和持久性(Durability)。 安全环 每一个环都由若干物理机组成,环内的DN形成主、备、从备关系,不向环外延伸。也就是说,环内的任何一个节点的主,或者备,或从备,依然在环内。扩容与缩容时,是以环为最小单位进行的。 Bgwriter 数据库启动时创建的一个后台写线程,此线程用于将数据库中脏页面写入到持久性设备(例如磁盘)中。 bit 比特。计算机处理的最小的信息单位。比特用来表示二进制数字1或0,或者一种逻辑条件真或假。在物理上,比特表示一个电路上高或低的电压点或者磁盘上的磁化单程或其它。一个单独的比特位所传达的信息很少有意义的。然而,一个8位组却构成了一个字节,可用于表示如一个英文字母,十进制数字,或其它字符等多种类型的信息。 Bloom Filter 布隆过滤器。由Howard Bloom在1970年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,这种检测只会对在集合内的数据错判,而不会对不是集合内的数据进行错判,这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见Bloom filter是牺牲了正确率换取时间和空间。 CCN Central Coordinator , GaussDB (DWS)动态负载管理中心协调节点。负责进行各CN中复杂作业是否可以执行的中心判断、排队和调度,以实现动态负载管理。 CIDR Classless Inter-Domain Routing,无类域间路由IP编址方案。CIDR摒弃传统的基于类(A类:8,B类:16,C类:24)的地址分配方式,允许使用任意长度的地址前缀,有效提高地址空间的利用率。CIDR表示方法:IP地址/网络ID的位数。比如192.168.23.35/21,其中“21”表示前面地址中的前21位代表网络部分,其余位代表主机部分。 Cgroups Control Groups,控制组(GaussDB(DWS)中也称之为优先级组)。SUSE Linux和RedHat内核提供的一种可以限制、记录、隔离进程组所使用的物理资源的机制。 CLI Command-line Interface,命令行界面。应用程序和用户交互的一种方式,完全基于文本输入和输出。命令通过键盘或类似装置输入,由程序编译并执行。结果是以文本或图形的方式呈现在终端界面。 CM Cluster Manager,集群管理模块。管理和监控分布式系统中各个功能单元和物理资源的运行情况,确保整个系统的稳定运行。 CMS Cluster Management Service,集群管理服务。是用于管理集群状态的部件。 CN Coordinator,负责数据库系统元数据存储、查询任务的分解和部分执行,以及将DN中查询结果汇聚在一起。 CU Compression Unit,压缩单元。列存表的最小存储单位。 core文件 当程序出现内存越界、断言失败或者访问非法内存时,操作系统会中止进程,并将当前内存状态导出到core文件中,以便进一步分析。 core文件包含内存转储,支持全二进制和指定端口格式。core文件名称由字符串core以及操作系统进程ID组成。 core文件不依赖于任何平台。 Core Dump 通常在程序异常终止时,核心转储(Core Dump)、内存转储或系统转储用于记录特定时间计算机程序工作内存的状态。实际上,其它关键程序的状态经常在同一时间进行转储,例如处理器寄存器,包括程序指标和栈指针、内存管理信息、其它处理器和操作系统标记及信息。Core Dump经常用于辅助诊断和纠错计算机程序问题。 DBA Database Administrator,数据库管理员。指导或执行所有和维护数据库环境相关的操作。 DBLINK DBLINK是定义一个数据库到另一个数据库路径的对象,通过它可以查询远程数据库对象。 DBMS Database Management System,数据库管理系统。数据库管理系统是为了访问数据库中的信息而使用的一个管理系统软件。它包含一组程序使用户可以进入、管理、查询数据库中数据。基于真实数据的位置,可以分为内存数据库管理系统和磁盘数据库管理系统。 DCL Data Control Language,数据控制语言。 DDL Data Definition Language,数据定义语言。 DML Data Manipulation Language,数据操纵语言。 DN Data Node,和CN对应的概念。负责实际执行表数据的存储、查询操作。 ETCD Editable Text Configuration Daemon,分布式键值存储系统,用于共享配置和服务发现(服务注册和查找)。 ETL Extract-Transform-Load,描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。 Extension Connector Extension Connector是GaussDB(DWS)提供的功能模块,使用它可以将SQL语句发送到集群外部的Spark,并在当前库中返回执行结果,实现跨集群处理数据。 备份 备份件或者备份过程。指复制并归档计算机数据,当发生数据丢失事件时,可以用该复制并归档的数据来恢复原始数据。 备份和恢复 保护数据库防止由于媒介失效或人为错误造成的数据丢失过程中涉及的一组概念、过程及策略。 备机 GaussDB(DWS)双机方案中的一个节点,用于作为主机的备份,在主机异常时,备机会切换到主机状态,以确保能正常提供数据服务。 崩溃 崩溃(或系统崩溃)指计算机或程序(例如软件应用程序或操作系统)异常终止的事件。出现错误后,通常会自动退出。有时出现恶意程序冻结或挂起直到崩溃上报服务记录崩溃的详细信息。对于操作系统内核关键部分的程序,整个计算机可能瘫痪(可能造成致命的系统错误)。 编码 编码是指用代码来表示各组数据资料,使其成为可利用计算机进行处理和分析的信息。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。 编码技术 呈现计算机软硬件识别的特定字符集数据的技术。 表 表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。例如,一个表可能有3个字段:姓名、城市和国家。这个表就会有3列:一列代表姓名,一列代表城市,一列代表国家。表中的每一行包含3个字段的内容,姓名字段包含姓名,城市字段包含城市,国家字段包含国家。 表空间 包含表、索引、大对象、长数据等数据的逻辑存储结构。表空间在物理数据和逻辑数据间提供了抽象的一层,为所有的数据库对象分配存储空间。表空间创建好后,创建数据库对象时可以指定该对象所属的表空间。 并发控制 在多用户环境下同时执行多个事务并保证数据完整性的一个DBMS服务。并发控制是GaussDB(DWS)提供的一种多线程管理机制,用来保证多线程环境下在数据库中执行的操作是安全的和一致的。 查询 向数据库发出的信息请求,包含更新、修改、查询或删除信息的请求。 查询操作符 Query Operator,也称为查询迭代算子(Iterator)或查询节点(Query Tree Node)。一个查询的执行可以分解为一个或多个查询操作符,是构成一个查询执行的最基本单位。常见的查询操作符包括表扫描(Scan),表关联(Join),表聚集(Aggregation)等。 查询片段 每一个查询任务都可以分解成为一个或者多个查询片段。每个查询片段由一个或多个查询操作符构成,可独立在节点上运行。通过数据流操作符与其它查询片段块交换数据。 持久性 数据库事务的ACID特性之一。在事务完成以后,该事务对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。 存储过程 存储过程(StoredProcedure)是在大型数据库系统中,一组为了完成特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名称并设置参数(如果该存储过程带有参数)来执行它。 操作系统 操作系统OS(operating system)由引导程序加载到计算中,对计算机中其它程序进行管理。其它程序叫做应用或应用程序。 从备 Secondary,为了保证集群的高可靠性,主、备间无法正常同步数据时,主节点会将日志同步到从备。如果主节点突然故障不可用,备节点会升主,并且升主成功后从从备节点上同步之前异常期间的日志。 大对象 大对象(Blob)在数据库中指使用二进制方式存储的数据。它通常可以用于存储视频、音频和图像等多媒体数据。 动态负载 GaussDB(DWS)动态负载是指基于系统中CPU、I/O、内存等资源的使用情况,自动调节并发作业的运行数量,避免因为系统资源过载导致业务报错或无响应。 段 数据库中,一段指包含一个或多个区域的数据库中的一部分。区域是数据库的最小范围,由单元调用块组成。一个或多个段组成一个表空间。 F – J Failover 指当某个节点出现故障时,自动切换到备节点上的过程。反之,从备节点上切换回来的过程称为Failback。 FDW Foreign Data Wrapper,外部数据封装器。是Postgres提供的一个SQL接口,用于访问远程数据存储中的大数据对象,使DBA可以整合来自不相关数据源的数据,将它们存入数据库中的一个公共模型。 Freeze 在事务ID耗尽时由AutoVacuum Worker进程自动执行的操作。GaussDB(DWS)会把事务ID记在行头,在一个事务取得一行时,通过比较行头的事务ID和事务本身的ID判断这行是否可见,而事务ID是一个无符号整数,如果事务ID耗尽,事务ID会跨过整数的界限重新计算,此时原先可见的行就会变成不可见的行,为了避免这个问题,Freeze操作会将行头的事务标记为一个特殊的事务ID,标记了这个特殊的事务ID的行将对所有事务可见,以此避免事务ID耗尽产生的问题。 GDB GNU工程调试器,可以监控其它程序运行时的内部情况,或者其它程序要崩溃时发生了什么。GDB支持如下四种主要操作(使PDK功能更加强大),辅助查找缺陷。 启动程序,指定可能影响行为的任何因素。 特定条件下,停止程序。 程序停止时,检查发生了什么。 修改程序内容,尝试纠正一个缺陷并继续下一个。 GDS General Data Service,数据并行加载工具。向GaussDB(DWS)导入数据时,需要将此工具部署到源数据所在的服务器上,使DN可以通过该工具获取数据。 GIN索引 Generalized Inverted Index,通用倒排索引。作用为处理索引项为组合值的情况,查询时需要通过索引搜索出出现在组合值中的特定元素值。 GNU GNU计划,又称革奴计划,是由RichardStallman在1983年9月27日公开发起的。它的目标是创建一套完全自由的操作系统。GNU是“GNU's NotUnix”的递归缩写。Stallman宣布GNU应当发音为Guh-NOO以避免与new这个单词混淆(注:Gnu在英文中原意为非洲牛羚,发音与new相同)。Unix是一种广泛使用的商业操作系统的名称。技术上讲,GNU类似Unix。但是GNU却给了用户自由。 gsql GaussDB(DWS)交互终端。通过gsql能够以交互的方式输入查询,下发查询到GaussDB(DWS),然后查看查询结果。或者,也可以从文件中输入。此外,gsql还提供许多元命令和各种类似shell命令,协助脚本编写及自动化各种任务。 GTM Global Transaction Manager,全局事务管理器。用于管理事务状态的部件。 GUC Grand Unified Configuration,数据库运行参数。配置这些参数可以影响数据库系统的行为。 HA 高可用性(HighAvailability),通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。 HBA host-based authentication,主机认证。主机鉴权允许主机鉴权部分或全部系统用户。适用于系统所有用户或者使用Match指令的子集。该类型鉴权对于管理计算集群以及其它完全同质设备非常有用。总之,服务器上的三个文件以及客户端上的一个文件必须修改,为主机鉴权做准备。 HDFS Hadoop Distributed File System,Apache Hadoop项目的一个子项目。一个高度容错的分布式文件系统,设计用于在低成本硬件上运行。HDFS提供高吞吐量应用程序数据访问功能,适合带有大型数据集的应用程序。 服务器 为客户端提供服务的软硬件的组合。单独使用时,指运行服务器操作系统的计算机,也可以指提供服务的软件或者专用硬件。 高级包 GaussDB(DWS)提供的具有一定逻辑和功能的存储过程、函数,这些具备功能的存储过程、函数统称为高级包。 隔离性 数据库事务的ACID特性之一。它是指一个事务内部的操作及使用的数据对其它并发事务是隔离的,并发执行的各个事务之间不能互相干扰。 关系型数据库 创建在关系模型基础上的数据库。关系型数据库借助于集合代数等数学概念和方法来处理数据库中的数据。 归档线程 数据库打开归档功能时启动的一个线程,此线程用于将数据库日志归档到指定的路径。 故障接管 功能对等的系统部件对于故障部件的自动替换过程。系统部件包含处理器、服务器、网络、数据库等。 环境变量 定义进程操作环境某一方面的变量。例如,环境变量可以为主目录,命令搜索路径,使用终端或当前时区。 检查点 将数据库内存中某一时刻的数据存到磁盘的机制。GaussDB(DWS)定期将已提交的事务数据和未提交的事务数据存到磁盘,这些数据用来和Redo日志一起在数据库重启和崩溃时恢复数据库。 加密 用于传输数据的功能。通过该功能,可以隐藏信息内容,防止非法使用。 节点 将构成GaussDB(DWS)集群环境的各台服务器(物理机或虚拟机)称为集群节点,简称节点。 纠错 系统自动识别软件和数据流上的错误并自动修正错误的能力,提升系统的稳定性和可靠性。 进程 在单个计算机上执行程序的实例。一个进程由一个或多个线程组成。其它进程不能接入某个进程已占用的线程。 基于时间点恢复 PITR(Point-In-TIme Recovery),基于时间点恢复是GaussDB(DWS)备份恢复的一个特性,是指在备份数据和WAL日志正常的情况下,数据可以恢复到指定时间点。 记录 在关系型数据库中,每一条记录对应表中的每一行数据。 集群 集群是由一组服务器和其它资源组成的一个单独的系统,可以实现高可用性。有的情况下,可以实现负载均衡及并行处理。 K – O LLVM LLVM命名最早源自于底层虚拟机(Low Level Virtual Machine)的缩写。LLVM是构架编译器(compiler)的框架系统,以C++编写而成,用于优化以任意程序语言编写的程序的编译时间(compile-time)、链接时间(link-time)、运行时间(run-time)以及空闲时间(idle-time),对开发者保持开放,并兼容已有脚本。 GaussDB(DWS) LLVM动态编译技术可以为每个查询生成定制化的机器码用于替换原本的通用函数。通过减少实际查询时冗余的条件逻辑判断、虚函数调用并提高数据局域性,从而达到提升查询整体性能的目的。 LVS Linux Virtual Server,虚拟服务器集群系统,用于负责集群的负载均衡。 MPP Massive Parallel Processing,大规模并行处理。指利用多个机器构成集群的架构方式,也称为集群(Cluster)系统。 MVCC Multi-Version Concurrency Control,多版本并发控制。数据库并发控制协议的一种,它的基本算法是一个元组可以有多个版本,不同的查询可以工作在不同的版本上。一个基本的好处是读和写可以不冲突。 NameNode NameNode是Hadoop系统中的一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问。 OLAP Online Analytical Processing,联机分析处理。是 数据仓库 系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。 OM Operations Management,运维管理模块。提供集群日常运维、配置管理的管理接口、工具。 ORC Optimized Row Columnar,一种广泛使用的Hadoop系统结构化数据的文件格式,由Hadoop HIVE项目引入。 客户端 连接或请求其它计算机或程序服务的计算机或程序。 空闲空间管理 管理表内空闲空间的机制,通过记录每个表内空闲空间信息,并建立易于查找的数据结构,可以加速对空闲空间进行的操作(例如INSERT)。 跨集群 GaussDB(DWS)支持通过外表和Extension Connector访问当前GaussDB(DWS)集群外的其他DBMS中的数据,这种行为称为跨集群。 垃圾元组 是指使用DELETE和UPDATE语句删除的元组,GaussDB(DWS)在删除元组时只是打个删除标记,由Vacuum线程清理这种垃圾元组。 列 字段的等效概念。在数据库中,表由一列或多列组成。 逻辑节点 一个物理节点上可以安装多个逻辑节点。一个逻辑节点是一个数据库实例。 模式 数据库对象集,包括逻辑结构,例如表、视图、序、存储过程、同义名、索引、集群及数据库链接。 模式文件 用于决定数据库结构的SQL文件。 P – T Page GaussDB(DWS)数据库关系对象结构中行存的最小存储单元。一个Page大小为默认为8KB。 PostgreSQL PostgreSQL是一个开源的关系数据库管理系统(DBMS),由全球志愿者团队开发。PostgreSQL不受任何公司或个体所控制,源代码免费使用。 Postgres-XC 一款多节点同步,读写可扩展的PostgreSQL集群数据库。 Postmaster 数据库服务启动时启动的一个线程。用于监听来自集群其它节点或客户端的连接请求。 主机上监听到备机连接请求,并接受后,就会创建一个WAL Sender线程,用于处理与备机的交互。 RHEL Red Hat Enterprise Linux,红帽企业Linux。 REDO日志 记录对数据库进行操作的日志,这些日志包含重新执行这些操作所需要的信息。当数据库故障时,可以利用REDO日志将数据库恢复到故障前的状态。 SCTP Stream Control Transmission Protocol,流控制传输协议。是IETF于2000年新定义的一个传输层协议。是提供基于不可靠传输业务的协议之上的可靠的数据报传输协议。SCTP的设计用于通过IP网传输SCN窄带信令消息。 Savepoint 保存点。是一种在关系数据库管理系统中实现子事务(也称为嵌套事务)的方法。在一个长事务中,可以把操作过程分成几部分,前面部分执行成功后,可以建一个保存点,若后面的执行失败,则回滚到这个保存点即可,无需回滚整个事务。保存点对于在数据库应用程序中实现复杂错误恢复很有用。如果在多语句事务中发生错误,则应用程序可能能够从错误中恢复(通过回滚到保存点)而无需中止整个事务。 Session 数据库系统在接收到应用程序的连接请求时,为该连接创建的一个任务。它被Session Manager管理,完成一些初始化任务,执行用户的所有操作。 Shared-nothing architecture 无共享架构是一种分布式计算架构,这种架构中不存在集中共享CPU、存储的状态,这种架构具有非常强的扩展性。 SLES SUSE Linux Enterprise Server,由SUSE提供的企业级Linux操作系统。 SMP Symmetric Multi-Processing,对称多处理技术,是指在一台计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。操作系统必须支持多任务和多线程处理,以使得SMP系统发挥高效的性能。数据库领域的SMP并行技术,一般指利用多线程技术实现查询的并行执行,以充分利用CPU资源,从而提升查询性能。 SQL Structure Query Language,结构化查询语言。数据库的标准查询语言。它可以分为数据定义语言(DDL),数据操纵语言(DML)和数据控制语言(DCL)。 SSL Secure Socket Layer,安全套接层。SSL是Netscape公司率先采用的网络安全协议。它是在传输通信协议(TCP/IP)上实现的一种安全协议,采用公开密钥技术。SSL广泛支持各种类型的网络,同时提供三种基本的安全服务,它们都使用公开密钥技术。SSL支持服务通过网络进行通信而不损害安全性。它在客户端和服务器之间创建一个安全连接。然后通过该连接安全地发送任意数据量。 收敛比 交换机下行带宽与上行带宽的比值。收敛比越高,流量收敛程度越大,丢包越严重。 TCP Transmission Control Protocol,传输控制协议。用于将数据信息分解成信息包,使之经过IP协议发送;并对利用IP协议接收来的信息包进行校验并将其重新装配成完整的信息。TCP是面向连接的可靠协议,能够确保信息的无误发送。 trace 一种特殊的日志记录方法,用来记录程序执行的信息。程序员使用该信息进行纠错。另外,根据trace日志中信息的类型和内容,有经验的系统管理员或技术支持人员以及软件监控工具诊断软件常见问题。 全备份 备份整个数据库集群。 全量同步 GaussDB(DWS)双机方案中的一种数据同步机制,是指把主机中的所有数据同步给备机。 日志文件 计算机记录自身活动的记录。 事务 数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成,事务必须满足ACID原则。 数据 事实或指令的一种表达形式,适用于人为或自动的通信、解释或处理。数据包含常量、变量、阵列和字符串。 数据重分布 用户改变数据的分布方式后,数据表在节点间重新分布的过程。 数据分布 表数据在分布式环境中的分布方式(Distribution),即数据表以何种方式打散存储到各个数据库实例上去。具体的分布方式可以有:散列(Hash)方式,复制方式(Replication)和随机方式(Random)。散列方式根据元组中指定字段的取值算得哈希值,根据节点与哈希值的映射关系获得该元组的目标存储位置。复制方式将元组复制到所有节点上。随机方式将数据随机分布到各节点。 数据分区 数据分区是指在一个数据库实例内部,将表按照划分为多个数据互不重叠的部分(Partition)。具体的分区方式可以有:范围分区(Range),它根据元组中指定字段的取值所处的范围映射到目标存储位置。 数据库 数据库是存储在一起的相关数据的集合,这些数据可以被访问,管理以及更新。同一视图中,数据库可以根据存储内容类型分为以下几类:数目类、全文本类、数字类及图像类。 数据库实例 一个数据库实例是一个GaussDB(DWS)进程以及它控制的数据库文件。GaussDB(DWS)在一个物理节点上安装多个数据库实例,集群各节点上所安装的GTM、CM、CN、DN统称为实例。一个数据库实例也被称为一个逻辑节点。 数据库双机 GaussDB(DWS)提供的高可靠性双机方案。在此方案中,每个GaussDB(DWS)逻辑节点标识为主机或备机。在同一时间内,只有一个GaussDB(DWS)被标识为主机。双机初次建立时,主机会对每个备机数据做全量同步,然后做增量同步。双机建立之后的运行过程中,主机能接受数据读和写的操作请求,备机只做日志同步。 数据库文件 保存用户数据和数据库系统内部数据的二进制文件。 数据流操作符 负责查询片段间交换数据的操作符。根据数据流的输入、输出关系,可以细分为聚合流(Gather)、广播流(Broadcast)和重分布流(Redistribution)。聚合流将数据从多个查询片段聚合到一个。广播流将数据从一个查询片段向多个传输。重分布流则将多个查询片段的数据,按照一定规则重组后向多个传输。 数据字典 数据字典是一系列只读的表,用来提供数据库的信息。这些信息包括:数据库设计信息、存储过程信息、用户权限、用户统计数据、数据库进程信息、数据库增长统计数据和数据库性能统计数据。 死锁 为使用同一资源而产生的无法解决的争用状态。 索引 数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。 统计信息 数据库使用统计信息估算查询代价,以查找代价最小的执行计划,统计信息一般是数据库自动收集的,包括表级信息(元组数、页面数等)和列级信息(列的值域分布直方图)。 停用词 在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。 U – Z Vacuum 数据库定期启动的清理垃圾元组的线程,根据配置参数可以同时启动多个。 verbose verbose选项指定显示在屏幕上的处理信息。 WAL Write-Ahead Logging,预写日志系统。实现事务日志的标准方法,是指对数据文件(表和索引的载体)持久化修改之前必须先持久化相应的日志。 WAL Receiver 数据库复制时备机创建的一个线程的名称。此线程用于从主机接收数据、命令,并反馈确认信息至主机。一个备机只有一个WAL Receiver线程。 WAL Sender 数据库复制过程中,主机接受到备机的连接请求后创建的一个线程的名称。此线程用于发送命令、数据到备机,并从备机接收信息。一个主机可能会有多个WAL Sender线程,每一个WAL Sender线程对应一个备机的一个连接请求。 WAL Writer 数据库启动时创建的一个写Redo日志的线程,用于将内存中的日志写入到持久性设备(如:磁盘)。 WLM WorkLoad Manager,负载管理。GaussDB(DWS)中系统资源控制和分配的模块。 Xlog 表示事务日志,一个逻辑节点中只有一个,不允许创建多个Xlog文件。 xDR 详单。用户面和信令面详单的统称,包括CDR和UFDR、TDR和SDR。 网络备份 网络备份为各种平台提供一套完整的、灵活的数据保护方案。平台包含Windows、UNIX及Linux。网络备份支持备份、归档、恢复计算机上的文件、文件夹或目录、卷或分区。 物理节点 一个物理机器称为一个物理节点。 系统表 存储数据库元信息的表,元信息包括数据库中的用户表、索引、列、函数和数据类型等。 下推 GaussDB(DWS)是 分布式数据库 ,其可以利用多DN分布式并行执行查询计划,即将CN中的查询计划下发到各DN中并行执行。这种行为称为下推。与将数据抽取到CN上执行查询的方式相比,下推可以大幅提升查询性能。 压缩 数据压缩,信源编码,或比特率降低涉及使用相比原来较少比特的编码信息。压缩可以是有损或无损。无损压缩通过识别和消除统计冗余降低比特位。无损压缩中没有信息丢失。有损压缩识别并删除次要信息,减少了比特位。减少数据文件大小的方法被普遍称为数据压缩,尽管其正式名称为源编码(数据源的编码,然后将其存储或传输)。 一致性 数据库事务的ACID特性之一。在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。 元数据 用来定义数据的数据。主要是描述数据自身信息,包含源、大小、格式或其它数据特征。数据库字段中,元数据用于理解以及诠释数据仓库的内容。 原子性 数据库事务的ACID特性之一。整个事务中的所有操作,要么全部完成,要么全部不完成,不可能停滞在中间某个环节。事务在执行过程中发生错误,会被回滚到事务开始前的状态,就像这个事务从来没有执行过一样。 在线扩容 在线扩容是指GaussDB(DWS)扩容重分布过程中支持数据持续入库、查询业务不中断。 脏页面 已经被修改且未写入持久性设备的页面。 增量备份 基于上次有效备份之后对文件修改的备份。 增量同步 GaussDB(DWS)双机方案中的一种数据同步机制,是指把主机中数据增量同步给备机,即只同步主备间有差异的数据。 主机 GaussDB(DWS)数据库双机系统中接受数据读写操作的节点,和所有备机一起协同工作。在同一时间内,双机系统中只有一个节点被标识为主机。 主题词 在标引和检索中用以表达文献主题的规范化的词或词组。 转储文件 转储文件是一种特定类型的trace文件。转储文件为响应事件过程中一次性输出的诊断数据,trace文件指诊断数据的连续输出。 资源池 资源池是GaussDB(DWS)提供的一种资源划分的配置机制。通过将用户绑定到资源池,来限定其所执行作业的优先级及能够利用到的资源。 租户 数据库业务用户在给定的计算资源(cpu,内存和io)和存储资源下执行业务,通过资源管理和隔离,达成业务的服务等级协定(SLA)。 最小恢复点 最小恢复点是GaussDB(DWS)提供的数据一致性保障手段之一。最小恢复点特性可以在GaussDB(DWS)启动时检查出WAL日志和持久化到磁盘的数据的不一致性,并提示用户进行处理。
  • GS_RESPOOL_RUNTIME_INFO GS_RESPOOL_RUNTIME_INFO视图显示当前CN所有资源池作业运行信息。 表1 GS_RESPOOL_RUNTIME_INFO字段 名称 类型 描述 nodegroup name 资源池所属逻辑集群名称,默认集群显示"installation" rpname name 资源池名称 ref_count int 资源池引用作业数,作业经过资源池不管是否管控都会计数 fast_run int 资源池快车道运行作业数 fast_wait int 资源池快车道排队作业数 slow_run int 资源池慢车道运行作业数 slow_wait int 资源池慢车道排队作业数 父主题: 系统视图
  • 异常处理原则 任何在PL/pgSQL函数中发生的错误会中止该函数的执行,而且实际上会中止其周围的事务。你可以使用一个带有EXCEPTION子句的BEGIN块俘获错误并且从中恢复。 在使用PL/PGSQL块中,如果使用了不能返回确定结果的SQL语句,宜在EXCEPTION中对程序可能出现的异常进行处理,避免出现未处理的出错被传递到外层块,导致程序逻辑错误。 对于系统已经定义了的异常,可以直接使用。DWS暂不支持自定义异常。 进入和退出一个包含EXCEPTION子句的块要比不包含的块开销大的多。因此,非必要场景不应使用EXCEPTION。
  • 书写规范 变量命名规则: 过程、函数的输入参数格式宜为:IN_参数名,参数名宜使用大写。 过程、函数的输出参数格式宜为:OUT_参数名,参数名宜使用大写。 过程、函数得输入输出参数格式宜为:IO_参数名,参数名宜使用大写。 过程、函数得程序中用到的变量宜由v_变量名组成,变量名宜使用小写。 将查询语句做成字符串拼接时,where语句的拼接变量名宜统一为v_where,select语句的拼接变量名宜为v_select。 记录(RECORD)的类型(TYPE)命名宜由T+变量名组成,名称宜使用大写。 游标命名宜由CUR+变量名组成,名称宜使用大写。 引用游标(REF CURSOR)的命名宜由REF+变量名组成,名称宜使用大写。 变量类型定义: 变量类型声明时,如果其含义和应用表某字段含义相同时,应使用%TYPE声明。 记录类型声明时,如果其含义和某应用表行数据相同时,应使用%ROWTYPE声明。 注释规范: 注释应该是有意义的,而不应是重述代码。 注释应简洁、易懂,以中文为主。为了表达准确,名词或操作上也可以使用英文。 应在每个存储过程、函数得开始加入注释,内容应包括:本程序的简要功能描述、编写者、编写日期、程序版本号信息和程序变更信息,而且各存储过程开头注释应保持统一格式。 应在输入输出参数的旁边添加注释,注明次变量的意义。 每个块或大分支的开始宜添加注释,描述块的简要功能,若使用算法,宜添加注释简单描述算法的目的和结果。 变量声明格式: 每行应只包含一条语句,如同时需要赋初始值,应在同一行书写。 大小写规范: 除了变量名,应一律使用大写。 缩进规范: 创建存储过程语句中,同一层的CREATE、AS/IS、BEGIN、END这几个关键字应位于同一列,其他部分依次缩进。 语句详述: 变量定义语句。每行应只包含一条语句。 同一层的IF、ELSEIF、ELSE和END关键字应开始于同一列,执行语句缩进。 CASE和END关键字应位于同一列,WHEN和ELSE关键字应缩进。 同一层的LOOP和END LOOP关键字应位于同一列,层内语句或嵌套应依次缩进。
  • 总体开发原则 应完全按照设计文档进行开发。 程序模块应做到高内聚低耦合。 应有正确、全面的故障对策。 程序编写应做到结构合理,条理清晰。 程序名称命名应按照统一的命名规则进行命名。 应充分考虑程序的运行效率,包括程序的执行效率和数据库的查询、存储效率,在保证应用的同时应使用效率高的处理方法。 程序注释应详细、正确、规范。 除非应用特别需要控制commit和rollback的提交时机,否则应在存储过程结束时执行显式的commit或者rollback操作。 程序处理应支持7*24小时;对于中断,应用程序应提供安全、简单的断点再续处理。 应提供标准、简单的应用输出,为应用维护人员提供明确的进度显示、错误描述和运行结果;为业务人员提供明确、直观的报表、凭证输出。
  • 程序编写原则 在PL/PGSQL中的SQL语句宜使用绑定变量。 在PL/PGSQL中的SQl语句宜使用RETURNING字句。 存储过程使用原则: 对于单个存储过程中Varchar或者Varchar2类型输出参数个数不应超过50个。 不应使用long类型作为输入或输出参数。 对于大小超过10MB的字符串类型输出,应使用CLOB类型。 变量声明原则: 变量声明时,如果含义和应用表某字段含义或某变量相同时,应使用%TYPE声明。 记录声明时,如果含义和某应用表行数据相同时,应使用%ROWTYPE声明。 变量声明每行应只包含一条语句。 不应声明LONG类型的变量。 游标使用类型: 显式游标使用后应关闭。 游标变量使用后应关闭,若游标变量需要传递数据给调用的应用程序,应在应用程序中进行游标关闭处理;若游标变量仅在存储过程中使用,应显式关闭游标。 在使用DBMS_SQL.CLOSE_CURSOR关闭游标前,应使用DBMS_SQL.IS_OPEN判断游标是否已打开。 集合使用原则: 引用集合中的元素时宜使用FORALL语句,不宜使用FOR循环语句。 动态语句使用原则: 联机系统的交易程序不宜使用动态SQL。 PL/PGSQL中要实现DDL语句和系统控制命令,可使用动态SQL。 宜尽量使用变量绑定。 拼装SQL的使用原则: 拼装SQL宜使用绑定变量。 拼装SQL语句的条件如果有外部输入源,应对输入条件进行字符检查,防止攻击。 在PL/PGSQL脚本中,单行代码的长度,不宜超过2499字符。 Trigger使用原则: Trigger可用于实现差量数据日志等于业务处理无关的可用性设计场景。 不应使用Trigger实现业务处理相关功能。
  • GS_RESPOOL_RESOURCE_HISTORY GS_RESPOOL_RESOURCE_HISTORY表记录资源池监控历史信息,CN和DN上均进行记录。 表1 GS_RESPOOL_RESOURCE_HISTORY字段 名称 类型 描述 timestamp timestamp 资源池监控信息持久化时间 nodegroup name 资源池所属逻辑集群名称,默认集群显示"installation" rpname name 资源池名称 cgroup name 资源池关联控制组名称 ref_count int 资源池引用作业数,作业经过资源池不管是否管控都会计数,仅CN上有效 fast_run int 资源池快车道运行作业数,只在CN上有效 fast_wait int 资源池快车道排队作业数,只在CN上有效 fast_limit int 资源池快车道作业并发限制,只在CN上有效 slow_run int 资源池慢车道运行作业数,只在CN上有效 slow_wait int 资源池慢车道排队作业数,只在CN上有效 slow_limit int 资源池慢车道作业并发限制,只在CN上有效 used_cpu double 资源池5s监控周期内使用CPU个数平均值,保留小数点后2位 DN:显示当前DN上资源池使用的CPU个数 CN:显示所有DN上资源池使用CPU的累积和 cpu_limit int 资源池可用CPU的上限,CPU配额管控情况下为GaussDB可用CPU,CPU限额管控情况下为关联控制组CPU可用CPU DN:显示当前DN上资源池可用CPU上限 CN:显示所有DN上资源池可用CPU上限的累积和 used_mem int 资源池使用的内存大小,单位:'MB'’ DN:显示当前DN上资源池使用的内存大小 CN:显示所有DN上资源池使用内存的累积和 estimate_mem int 当前CN上,资源池运行作业的估算内存之和,只在CN上有效 mem_limit int 资源池可用内存上限,单位:'MB' DN:显示当前DN上资源池可用内存上限 CN:显示所有DN上资源池可用内存上限的累积和 read_kbytes bigint 资源池5s监控周期内逻辑读字节数,单位:'KB' DN:显示当前DN上资源池逻辑读字节数 CN:显示所有DN上资源池逻辑读字节的累积和 write_kbytes bigint 资源池5s监控周期内逻辑写字节数,单位:'KB' DN:显示当前DN上资源池逻辑写字节数 CN:显示所有DN上资源池逻辑写字节的累积和 read_counts bigint 资源池5s监控周期内逻辑读次数 DN:显示当前DN上资源池逻辑读次数 CN:显示所有DN上资源池逻辑读次数的累积和 write_counts bigint 资源池5s监控周期内逻辑写次数 DN:显示当前DN上资源池逻辑写次数 CN:显示所有DN上资源池逻辑写次数的累积和 read_speed double 资源池5s监控周期内逻辑读速率的平均值 DN:显示当前DN上资源池逻辑读速率 CN:显示所有DN上资源池逻辑读速率的累积和 write_speed double 资源池5s监控周期内逻辑写速率平均值 DN:显示当前DN上资源池逻辑写速率 CN:显示所有DN上资源池逻辑写速率的累积和 父主题: 系统表
  • PGXC_RESPOOL_RUNTIME_INFO PGXC_RESPOOL_RUNTIME_INFO视图显示所有CN上所有资源池作业运行信息。 表1 PGXC_RESPOOL_RUNTIME_INFO字段 名称 类型 描述 nodename name CN名称 nodegroup name 资源池所属逻辑集群名称,默认集群显示"installation" rpname name 资源池名称 ref_count int 资源池引用作业数,作业经过资源池不管是否管控都会计数 fast_run int 资源池快车道运行作业数 fast_wait int 资源池快车道排队作业数 slow_run int 资源池慢车道运行作业数 slow_wait int 资源池慢车道排队作业数 父主题: 系统视图
  • PGXC_COMM_QUERY_SPEED PGXC_COMM_QUERY_SPEED视图展示所有节点上所有query对应的流量信息。 表1 PGXC_COMM_QUERY_SPEED字段 名称 类型 描述 node_name text 节点名称。 query_id bigint 通信流对应的debug_query_id编号。 rxkB/s bigint 查询对应的通信流接收速率,单位Byte/s。 txkB/s bigint 查询对应的通信流发送速率,单位Byte/s。 rxkB bigint 查询对应的通信流接收数据总量,单位Byte。 txkB bigint 查询对应的通信流发送数据总量,单位Byte。 rxpck/s bigint 查询对应的通信包接收速率,单位packages/s。 txpck/s bigint 查询对应的通信包发送速率,单位packages/s。 rxpck bigint 查询对应的通信包接收总量,单位packages。 txpck bigint 查询对应的通信包发送总量,单位packages。 父主题: 系统视图
  • PG_COMM_QUERY_SPEED PG_COMM_QUERY_SPEED视图展示单个节点上所有query对应的流量信息。 表1 PG_COMM_QUERY_SPEED字段 名称 类型 描述 node_name text 节点名称。 query_id bigint 通信流对应的debug_query_id编号。 rxkB/s bigint 查询对应的通信流接收速率,单位Byte/s。 txkB/s bigint 查询对应的通信流发送速率,单位Byte/s。 rxkB bigint 查询对应的通信流接收数据总量,单位Byte。 txkB bigint 查询对应的通信流发送数据总量,单位Byte。 rxpck/s bigint 查询对应的通信包接收速率,单位packages/s。 txpck/s bigint 查询对应的通信包发送速率,单位packages/s。 rxpck bigint 查询对应的通信包接收总量,单位packages。 txpck bigint 查询对应的通信包发送总量,单位packages。 父主题: 系统视图
  • GS_RESPOOL_RESOURCE_INFO GS_RESPOOL_RESOURCE_INFO视图显示CN上所有资源池作业运行信息以及当前实例(CN/DN)所有资源池资源使用信息。 DN上仅显示当前DN所属逻辑集群的资源池监控信息。 表1 GS_RESPOOL_RESOURCE_INFO字段 名称 类型 描述 nodegroup name 资源池所属逻辑集群名称,默认集群显示"installation" rpname name 资源池名称 cgroup name 资源池关联控制组名称 ref_count int 资源池引用作业数,作业经过资源池不管是否管控都会计数,只在CN上有效 fast_run int 资源池快车道运行作业数,只在CN上有效 fast_wait int 资源池快车道排队作业数,只在CN上有效 fast_limit int 资源池快车道作业并发限制,只在CN上有效 slow_run int 资源池慢车道运行作业数,只在CN上有效 slow_wait int 资源池慢车道排队作业数,只在CN上有效 slow_limit int 资源池慢车道作业并发限制,只在CN上有效 used_cpu double 资源池5s监控周期内使用CPU个数平均值,保留小数点后2位 DN:显示当前DN上资源池使用的CPU个数 CN:显示所有DN上资源池使用CPU的累积和 cpu_limit int 资源池可用CPU的上限,CPU配额管控情况下为GaussDB可用CPU,CPU限额管控情况下为关联控制组CPU可用CPU DN:显示当前DN上资源池可用CPU上限 CN:显示所有DN上资源池可用CPU上限的累积和 used_mem int 资源池当前使用的内存大小,单位:'MB'’ DN:显示当前DN上资源池使用的内存大小 CN:显示所有DN上资源池使用内存的累积和 estimate_mem int 当前CN上,资源池运行作业的估算内存之和,只在CN上有效 mem_limit int 资源池可用内存上限,单位:'MB' DN:显示当前DN上资源池可用内存上限 CN:显示所有DN上资源池可用内存上限的累积和 read_kbytes bigint 资源池5s监控周期内逻辑读字节数,单位:'KB' DN:显示当前DN上资源池逻辑读字节数 CN:显示所有DN上资源池逻辑读字节的累积和 write_kbytes bigint 资源池5s监控周期内逻辑写字节数,单位:'KB' DN:显示当前DN上资源池逻辑写字节数 CN:显示所有DN上资源池逻辑写字节的累积和 read_counts bigint 资源池5s监控周期内逻辑读次数 DN:显示当前DN上资源池逻辑读次数 CN:显示所有DN上资源池逻辑读次数的累积和 write_counts bigint 资源池5s监控周期内逻辑写次数 DN:显示当前DN上资源池逻辑写次数 CN:显示所有DN上资源池逻辑写次数的累积和 read_speed double 资源池5s监控周期内逻辑读速率的平均值 DN:显示当前DN上资源池逻辑读速率 CN:显示所有DN上资源池逻辑读速率的累积和 write_speed double 资源池5s监控周期内逻辑写速率平均值 DN:显示当前DN上资源池逻辑写速率 CN:显示所有DN上资源池逻辑写速率的累积和 父主题: 系统视图
  • PGXC_RESPOOL_RESOURCE_INFO PGXC_RESPOOL_RESOURCE_INFO视图显示所有实例上资源池实时监控信息。 DN上仅显示当前DN所属逻辑集群的资源池监控信息。 从8.2.0集群版本开始,新增了内存负反馈机制功能,CCN节点会根据DN节点的实际内存使用情况辅助反向调节语句的估算内存统计值,缓解语句估算内存高估场景,当CCN节点触发通过负反馈机制来减少估算内存统计值来增发作业时,由于CCN节点更新了语句缩减后的估算内存统计值,而CN节点还保留了原先的估算内存统计值,会导致资源池监控视图中的估算内存超过资源池的上限。 语句的算子分为重内存算子和非重内存算子,对于语句的内存管控是重内存算子,非重内存算子的内存开销较小;由于非重内存算子的内存开销、线程初始化的开销、表达式的开销等这些内存不做管控,会导致资源池的used_mem会在一定程度上超过mem_limit值。 表1 PGXC_RESPOOL_RESOURCE_INFO字段 名称 类型 描述 nodename name 实例名称,包含CN和DN。 nodegroup name 资源池所属逻辑集群名称,默认集群显示"installation"。 rpname name 资源池名称。 cgroup name 资源池关联控制组名称。 ref_count int 资源池引用作业数,作业经过资源池不管是否管控都会计数,仅CN上有效。 fast_run int 资源池快车道运行作业数,只在CN上有效。 fast_wait int 资源池快车道排队作业数,只在CN上有效。 fast_limit int 资源池快车道作业并发限制,只在CN上有效。 slow_run int 资源池慢车道运行作业数,只在CN上有效。 slow_wait int 资源池慢车道排队作业数,只在CN上有效。 slow_limit int 资源池慢车道作业并发限制,只在CN上有效。 used_cpu double 资源池5s监控周期内使用CPU个数平均值,保留小数点后2位。 DN:显示当前DN上资源池使用的CPU个数。 CN:显示所有DN上资源池使用CPU的累积和。 cpu_limit int 资源池可用CPU的上限,CPU配额管控情况下为GaussDB(DWS)可用CPU,CPU限额管控情况下为关联控制组CPU可用CPU。 DN:显示当前DN上资源池可用CPU上限。 CN:显示所有DN上资源池可用CPU上限的累积和。 used_mem int 资源池当前使用的内存大小,单位MB。 DN:显示当前DN上资源池使用的内存大小。 CN:显示所有DN上资源池使用内存的累积和。 estimate_mem int 当前CN上,资源池运行作业的估算内存之和,只在CN上有效。 mem_limit int 资源池可用内存上限,单位MB。 DN:显示当前DN上资源池可用内存上限。 CN:显示所有DN上资源池可用内存上限的累积和。 read_kbytes bigint 资源池5s监控周期内逻辑读字节数,单位KB。 DN:显示当前DN上资源池逻辑读字节数。 CN:显示所有DN上资源池逻辑读字节的累积和。 write_kbytes bigint 资源池5s监控周期内逻辑写字节数,单位KB。 DN:显示当前DN上资源池逻辑写字节数。 CN:显示所有DN上资源池逻辑写字节的累积和。 read_counts bigint 资源池5s监控周期内逻辑读次数。 DN:显示当前DN上资源池逻辑读次数。 CN:显示所有DN上资源池逻辑读次数的累积和。 write_counts bigint 资源池5s监控周期内逻辑写次数。 DN:显示当前DN上资源池逻辑写次数。 CN:显示所有DN上资源池逻辑写次数的累积和。 read_speed double 资源池5s监控周期内逻辑读速率的平均值。 DN:显示当前DN上资源池逻辑读速率。 CN:显示所有DN上资源池逻辑读速率的累积和。 write_speed double 资源池5s监控周期内逻辑写速率平均值。 DN:显示当前DN上资源池逻辑写速率。 CN:显示所有DN上资源池逻辑写速率的累积和。 父主题: 系统视图
  • MPP_TABLES MPP_TABLES视图显示PGXC_CLASS中的表信息。 表1 MPP_TABLES字段 名称 类型 描述 schemaname name 包含表的模式名。 tablename name 表名。 tableowner name 表的所有者。 tablespace name 表所在的表空间。 pgroup name 节点群的名称。 nodeoids oidvector_extend 表分布的节点OID列表。 父主题: 系统视图
  • PV_RUNTIME_RELSTATS PV_RUNTIME_RELSTATS视图显示autoanalyze产生的内存中表级统计信息,各字段含义与PG_CLASS视图一样。 表1 PV_RUNTIME_RELSTATS字段 名称 类型 描述 nspname name 模式名 relname name 表、索引等对象的名称 relpages double precision 以页(大小为BLCKSZ)为单位的此表在磁盘上的大小,只是优化器使用的一个近似值。 reltuples double precision 表中行的数目,只是优化器使用的一个估计值。 relallvisible integer 被标识为全可见的表中的页数。此字段是优化器用来做SQL执行优化使用的。 relhasindex boolean 如果对象是一个表且至少有(或者最近建有)一个索引,则为真。 由CREATE INDEX设置,但DROP INDEX不会立即将它清除。如果VACUUM进程检测一个表没有索引,会清理relhasindex字段,将relhasindex值设置为假。 changes bigint 触发轻量化autoanalyze时,表的历史累计修改条数。 level text 轻量化autoanalyze生成的内存统计信息当前所处的阶段。包含: local, sendlist, global三个阶段。 父主题: 系统视图
  • PG_EXCEPT_RULE PG_EXCEPT_RULE系统表存储关于异常规则的信息。一个异常规则集合由多个名称相同的异常规则组成。 表1 PG_EXCEPT_RULE 名称 类型 描述 name name 异常规则集合的名称。 rule name 该异常规则集中某一个具体规则类型或者触发当前异常规则集时采取的操作。(如blocktime/elapsedtime/spillsize等类型或者触发异常规则后的操作) value name 该异常规则对应的规则阈值。如果是触发异常规则后的操作,那么该字段为abort。 父主题: 系统表
  • lc_messages 参数说明:设置信息显示的语言。 可接受的值是与系统相关的;在一些系统上,这个区域范畴并不存在,不过仍然允许设置这个变量,只是不会有任何效果。同样,也有可能是所期望的语言的翻译信息不存在。在这种情况下,用户仍然能看到英文信息。 参数类型:SUSET 取值范围:字符串 使用命令locale -a查看当前系统支持的区域和相应的编码格式,并可以选择进行设置。 默认情况下,gs_initdb会根据当前的系统环境初始化此参数,通过locale命令可以查看当前的配置环境。 默认值:C
  • default_text_search_config 参数说明:设置全文检索的配置信息。 如果设置为不存在的文本搜索配置时将会报错。如果default_text_search_config对应的文本搜索配置被删除,需要重新设置default_text_search_config,否则会报设置错误。 其被文本搜索函数使用,这些函数并没有一个明确指定的配置。 当与环境相匹配的配置文件确定时,gs_initdb会选择一个与环境相对应的设置来初始化配置文件。 参数类型:USERSET 取值范围:字符串 GaussDB(DWS)支持pg_catalog.english,pg_catalog.simple两种配置。 默认值:pg_catalog.english
  • IntervalStyle 参数说明:设置区间值的显示格式。 参数类型:USERSET 取值范围:枚举型 sql_standard表示产生与SQL标准规定匹配的输出。 postgres表示产生与PostgreSQL 8.4版本相匹配的输出,当DateStyle参数被设为ISO时。 postgres_verbose表示产生与PostgreSQL 8.4版本相匹配的输出,当DateStyle参数被设为non_ISO时。 iso_8601表示产生与在ISO 8601中定义的“格式与代号”相匹配的输出。 oracle表示产生于Oracle中与numtodsinterval函数相匹配的输出结果,详细请参考numtodsinterval。 IntervalStyle参数也会影响不明确的间隔输入的说明。 默认值:postgres
  • client_encoding 参数说明:设置客户端的字符编码类型。 请根据前端业务的情况确定。尽量客户端编码和服务器端编码一致,提高效率。 参数类型:USERSET 取值范围:兼容PostgreSQL所有的字符编码类型。其中UTF8表示使用数据库的字符编码类型。 使用命令locale -a查看当前系统支持的区域和相应的编码格式,并可以选择进行设置。 默认情况下,gs_initdb会根据当前的系统环境初始化此参数,通过locale命令可以查看当前的配置环境。 参数建议保持默认值,不建议通过gs_guc工具或其他方式直接在postgresql.conf文件中设置client_encoding参数,即使设置也不会生效,以保证集群内部通信编码格式一致。 默认值:UTF8 推荐值:SQL_ASCII/UTF8
  • DateStyle 参数说明:设置日期和时间值的显示格式,以及有歧义的输入值的解析规则。 这个变量包含两个独立的部分:输出格式声明(ISO、Postgres、SQL、German)和输入输出的年/月/日顺序(DMY、MDY、YMD)。这两个可以独立设置或者一起设置。关键字Euro和European等价于DMY;关键字US、NonEuro、NonEuropean等价于MDY 。 参数类型:USERSET 取值范围:字符串 默认值:ISO, MDY gs_initdb会将这个参数初始化成与lc_time一致的值。 设置建议:优先推荐使用ISO格式。Postgres、SQL和German均采用字母缩写的形式来表示时区,例如“EST、WST、 CS T”等。
  • 下载DSC SQL语法迁移工具 登录GaussDB(DWS) 管理控制台。 在左侧导航栏中,单击“连接管理”。 在“下载客户端和驱动”区域,单击“这里”即可下载DSC迁移工具。 如果同时拥有不同版本的集群,系统会弹出对话框,提示您选择“集群版本”然后下载与集群版本相对应的客户端。在“集群管理”页面的集群列表中,单击指定集群的名称,再选择“基本信息”页签,可查看集群版本。 图1 下载工具 下载到本机后,使用WinSCP工具,将DSC工具上传到一个需安装工具的Linux主机上。 执行上传操作的用户需要对Linux主机的目标存放目录有完全控制权限。
  • backslash_quote 参数说明:控制字符串文本中的单引号是否能够用\'表示。 参数类型:USERSET 在字符串文本符合SQL标准的情况下,\没有任何其他含义。这个参数影响的是如何处理不符合标准的字符串文本,包括明确的字符串转义语法是(E'...')。 取值范围:枚举类型 on表示一直允许使用\'表示。 off表示拒绝使用\'表示。 safe_encoding表示仅在客户端字符集编码不会在多字节字符末尾包含\的ASCII值时允许。 默认值:safe_encoding
  • 声明 GaussDB(DWS)的作者们在进行文档写作时努力基于商用角度,从使用场景和任务完成角度给出内容指引。即使这样,文档中依然可能存在对Postgres内容的引用和参考。对于这类内容,遵从如下的Postgres Copyright: Postgres-XC is Copyright © 1996-2013 by the PostgreSQL Global Development Group. PostgreSQL is Copyright © 1996-2013 by the PostgreSQL Global Development Group. Postgres95 is Copyright © 1994-5 by the Regents of the University of California. IN NO EVENT SHALL THE UNIVERSITY OF CALIFORNIA BE LIABLE TO ANY PARTY FOR DIRECT, INDIRECT, SPECIAL, INCIDENTAL, OR CONSEQUENTIAL DAMAGES, INCLUDING LOST PROFITS, ARISING OUT OF THE USE OF THIS SOFTWARE AND ITS DOCUMENTATION, EVEN IF THE UNIVERSITY OF CALIFORNIA HAS BEEN ADVISED OF THE POSSIBILITY OF SUCH DAMAGE. THE UNIVERSITY OF CALIFORNIA SPECIFICALLY DISCLAIMS ANY WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE. THE SOFTWARE PROVIDED HEREUNDER IS ON AN "AS-IS" BASIS, AND THE UNIVERSITY OF CALIFORNIA HAS NO OBLIGATIONS TO PROVIDE MAINTENANCE, SUPPORT, UPDATES, ENHANCEMENTS, OR MODIFICATIONS.
  • default_with_oids 参数说明:在没有声明WITH OIDS和WITHOUT OIDS的情况下,这个选项控制在新创建的表中CREATE TABLE和CREATE TABLE AS是否包含一个OID字段。它还决定SELECT INTO创建的表里面是否包含OID 。 不推荐在用户表中使用OID,故默认设置为off。需要带有OID字段的表应该在创建时声明WITH OIDS 。 参数类型:USERSET 取值范围:布尔型 on表示在新创建的表中CREATE TABLE和CREATE TABLE AS可以包含一个OID字段。 off表示在新创建的表中CREATE TABLE和CREATE TABLE AS不可以包含一个OID字段。 默认值:off
  • synchronize_seqscans 参数说明:控制启动同步的顺序扫描。在大约相同的时间内并行扫描读取相同的数据块,共享I/O负载。 参数类型:USERSET 取值范围:布尔型 on表示扫描可能从表的中间开始,然后选择"环绕"方式来覆盖所有的行,为了与已经在进行中的扫描活动同步。这可能会造成没有用ORDER BY子句的查询得到行排序造成不可预测的后果。 off表示确保顺序扫描是从表头开始的。 默认值:on
  • retry_ecode_list 参数说明:指定SQL语句出错自动重试功能支持的错误类型列表。 参数类型:USERSET 取值范围:字符串 默认值:YY001 YY002 YY003 YY004 YY005 YY006 YY007 YY008 YY009 YY010 YY011 YY012 YY013 YY014 YY015 53200 08006 08000 57P01 XX003 XX009 YY016 CG003 CG004 F0011 F0012 45003
  • transform_null_equals 参数说明:控制表达式expr = NULL(或NULL = expr)当做expr IS NULL处理。如果expr得出NULL值则返回真,否则返回假。 正确的SQL标准兼容的expr = NULL总是返回NULL(未知)。 Microsoft Access里的过滤表单生成的查询使用expr = NULL来测试空值。打开这个选项,可以使用该接口来访问数据库。 参数类型:USERSET 取值范围:布尔型 on表示控制表达式expr = NULL(或NULL = expr)当做expr IS NULL处理。 off表示不控制,即expr = NULL总是返回NULL(未知)。 默认值:off 新用户经常在涉及NULL的表达式上语义混淆,故默认值设为off。
  • td_compatible_truncation 参数说明:控制是否开启与Teradata数据库相应兼容的特征。该参数在用户连接上与TD兼容的数据库时,可以将参数设置成为on(即超长字符串自动截断功能启用),该功能启用后,在后续的insert语句中,对目标表中char和varchar类型的列插入超长字符串时,会按照目标表中相应列定义的最大长度对超长字符串进行自动截断。保证数据都能插入目标表中,而不是报错。 超长字符串自动截断功能不适用于insert语句包含外表的场景。 如果向字符集为字节类型编码(SQL_ASCII,LATIN1等)的数据库中插入多字节字符数据(如汉字等),且字符数据跨越截断位置,这种情况下,按照字节长度自动截断,自动截断后会在尾部产生非预期结果。如果用户有对于截断结果正确性的要求,建议用户采用UTF8等能够按照字符截断的输入字符集作为数据库的编码集。 参数类型:USERSET 取值范围:布尔型 on表示启动超长字符串自动截断功能。 off表示停止超长字符串自动截断功能。 默认值:off
  • 高可靠事务处理 GaussDB(DWS)提供集群事务管理功能,此功能是集群HA、集群故障切换的基础,负责保证集群所有节点间事务的ACID特性,保证故障可恢复,以及恢复后满足数据的ACID(Atomicity,Consistency,Isolation,Durability)特性,并负责节点的并发控制。 故障恢复 为了在集群出现故障时尽可能地不中断服务,GaussDB(DWS)提供了高可靠机制。通过保护关键用户程序对外不间断提供服务,把因为硬件、软件和人为造成的故障对业务的影响程度降到最低,以保证业务的持续性。 硬件级高可靠:磁盘Raid、交换机堆叠及网卡bond、不间断电源UPS(Uninterruptible Power Supply)。 软件级高可靠:GaussDB(DWS)集群CN、GTM、DN等全方位HA。 事务管理 支持事务块,用户可以通过start transaction命令显式启动一个事务块。 支持单语句事务,用户不显式启动事务,则单条语句就是一个事务。 分布式事务管理。支持全局事务信息管理,包括gxid、snapshot、timestamp的管理,分布式事务状态管理,gxid溢出的处理。 分布式事务支持ACID特性。 支持分布式死锁预防,保证在出现死锁时自动解锁或者预防死锁。 父主题: 系统概述
共100000条