DWS PL/pgSQL使用规则 总体开发原则 应完全按照设计文档进行开发。 程序模块应做到高内聚低耦合。 应有正确、全面的故障对策。 程序编写应做到结构合理,条理清晰。 程序名称命名应按照统一的命名规则进行命名。 应充分考虑程序的运行效率,包括程序的执行效率和数据库的查询、存储效率
创建和管理DWS视图 视图允许用户保存常用的或者复杂的查询。视图在磁盘上并没有被物理存储,当用户访问视图时查询会作为一个子查询运行。数据库中仅存放视图的定义,而不存放视图对应的数据,这些数据仍存放在原来的基本表中。若基本表中的数据发生变化,从视图中查询出的数据也随之改变。从这个意义上讲
创建和管理DWS Schema Schema又称作模式,从逻辑上组织一个数据库中的对象和数据。通过管理Schema,允许多个用户使用同一数据库而不相互干扰,同时便于将第三方应用添加到相应的Schema下而不引起冲突。 相同的数据库对象名称可以应用在同一数据库的不同Schema中,而没有冲突
分析表 ANALYZE支持的表类型有行/列存表、HDFS表、ORC/CARBONDATA格式的OBS外表。ANALYZE同时也支持对本地表的指定列进行信息统计。
快照存储在OBS中。
智能运维概览 GaussDB(DWS)提供智能运维功能,帮助用户快速高效地执行运维任务。智能运维会根据集群负载情况,选择合理时间窗、并发度完成用户指定的任务。在运维任务执行过程中,智能运维会时刻关注用户业务的变化,及时调整运维任务执行策略,以减轻对用户业务的影响。智能运维支持周期型和单次型任务的创建
您可以根据上述信息找到您所要的外部服务器,并记录下它的srvname和srvoptions的值。 切换为即将创建外部服务器的用户去连接其对应的数据库。
工具简介 本手册介绍数据仓库服务的工具使用,提供了客户端工具和服务端工具,客户端工具如表1所示,服务端工具如表2所示。 客户端工具:参见工具下载获取。 服务端工具:位于安装数据库服务器的$GPHOME/script和$GAUSSHOME/bin路径下。
可使用普通表检查数据是否倾斜的方法对物化视图进行检查,详细内容请参考《数据仓库服务开发指南》的“查看数据倾斜状态”章节。若物化视图的数据存储存在倾斜时,可参考《数据仓库服务开发指南》的“数据倾斜调优”章节进行存储层的倾斜调优。
可使用普通表检查数据是否倾斜的方法对物化视图进行检查,详细内容请参考《数据仓库服务开发指南》的“查看数据倾斜状态”章节。若物化视图的数据存储存在倾斜时,可参考《数据仓库服务开发指南》的“数据倾斜调优”章节进行存储层的倾斜调优。
' ); 创建external schema,SOURCE为hive,表关联的服务器为obs/hdfs server。
非日志表中的内容也不会被复制到备服务器中。在非日志表中创建的索引也不会被自动记录。 使用场景:非日志表不能保证数据的安全性,需要在确保数据已经做好备份的前提下使用,例如系统升级时进行数据的备份。
创建和管理GaussDB(DWS)索引 索引可以提高数据的访问速度,但同时也增加了插入、更新和删除操作的处理时间。所以是否要为表增加索引,索引建立在哪些字段上,是创建索引前必须要考虑的问题。需要分析应用程序的业务处理、数据使用、经常被用作查询的条件或者被要求排序的字段来确定是否建立索引
创建和使用GaussDB(DWS)序列 序列Sequence是用来产生唯一整数的数据库对象。序列的值是按照一定规则自增的整数。因为自增所以不重复,因此说Sequence具有唯一标识性。这也是Sequence常被用作主键的原因。 通过序列使某字段成为唯一标识符的方法有两种: 一种是声明字段的类型为序列整型
GaussDB(DWS) JDBC配置规则 目前,GaussDB(DWS)相关的第三方工具可以通过JDBC进行连接的,此部分将介绍工具配置时的注意事项。 连接参数 【关注】第三方工具通过JDBC连接GaussDB(DWS)时,JDBC向GaussDB(DWS)发起连接请求,会默认添加以下配置参数
GaussDB(DWS) SQL编写规则 DDL 【建议】在GaussDB(DWS)中,建议DDL(建表、comments等)操作统一执行,在批处理作业中尽量避免DDL操作。避免大量并发事务对性能的影响。 【建议】在非日志表(unlogged table)使用完后,立即执行数据清理
创建和管理DWS数据库 数据库(Database)是表、索引、视图、存储过程、操作符等对象的集合。DWS支持创建多个数据库,但是客户端程序一次只能连接并访问一个数据库,无法跨数据库进行查询。 模板和默认数据 DWS提供了两个模板数据库template0、template1,以及一个默认的数据库
创建和管理DWS分区表 分区表就是把逻辑上的一张表根据分区策略分成几张物理块库进行存储,这张逻辑上的表称之为分区表,物理块称之为分区。分区表是一张逻辑表,不存储数据,数据实际是存储在分区上的。当进行条件查询时,系统只会扫描满足条件的分区,避免全表扫描,从而提升查询性能。 分区表的优势
SQL on HDFS 支持OBS外表导出ORC格式数据。 支持解析XML函数 支持解析XML函数。 支持修改分布列 支持修改分布列。 支持CN故障job自动迁移 当前CN故障后,其对应的job任务可以自动迁移。 支持C函数平滑升级 支持客户的C函数平滑升级。
JSON类型 JSON数据类型可以用来存储JSON(JavaScript Object Notation)数据。 可以是单独的一个标量,也可以是一个数组,也可以是一个键值对象,其中数组和对象可以统称容器(container): 标量(scalar):单一的数字、bool、string