数据仓库服务 GaussDB(DWS)-关于GDS并行导入:导入流程

时间:2023-11-01 16:15:35

导入流程

图3 GDS并行导入流程
表1 流程说明

流程

说明

准备源数据。

准备需要导入数据库的源数据文件,并上传至数据服务器。

详细内容请参见准备源数据

启动GDS。

在数据服务器上安装配置并启动GDS。

详细内容请参见安装配置和启动GDS

创建外表。

创建外表用于识别数据源文件中的数据。外表中保存了数据源文件的位置、文件格式、存放位置、编码格式、数据间的分隔符等信息。

详细内容请参见创建GDS外表

执行导入数据。

在创建好外表后,通过INSERT语句,将数据快速、高效地导入到目标表中。详细内容请参见执行导入数据

处理错误表。

在数据并行导入发生错误时,请根据具体的错误信息进行处理,以保证导入数据的完整性。

详细内容请参见处理错误表

优化查询效率。

导入数据后,通过ANALYZE语句生成表统计信息。ANALYZE语句会将统计结果自动存储在系统表PG_STATISTIC中。执行计划生成器会使用这些统计数据,以生成最有效的查询执行计划。

停止GDS

待数据导入完成后,登录每台数据服务器,分别停止GDS。

GDS的停止请参见停止GDS

support.huaweicloud.com/devg-811-dws/dws_04_0190.html