Importación y exportación de datos de GaussDB(DWS)

GaussDB(DWS) proporciona una gama de soluciones que permiten importar y exportar datos en múltiples formatos.

Herramientas de importación y exportación

    Puede elegir entre las siguientes herramientas, según sea necesario, para importar datos a GaussDB(DWS) o exportarlos desde GaussDB(DWS).

Tabla 3-1 Herramientas de importación y exportación de datos

Uso
Herramienta

Importación o exportación por lotes de una gran cantidad de datos

GDS

Importación o exportación por lotes de una pequeña cantidad de datos

copiar en/desde (archivo/Stdin)

Exportación del conjunto de resultados de la consulta

copiar consulta en/desde (archivo/Stdin)

Importar una pequeña cantidad de datos a otras bases de datos o exportar dicha cantidad desde otras bases de datos

insertar valores / ETL

Respaldo/restauración de metadatos de bases de datos

gs_dump/gs_restore

Importación de datos desde HDFS

Tabla externa HDFS

Importación de datos desde OBS

Tabla externa de texto de OBS, tabla externa ORC de OBS

Migración/respaldo de datos entre clústeres

Roach

Gauss Data Service (GDS)

    La herramienta Gauss Data Service (GDS) se puede usar para importar y exportar texto de manera eficiente.

    Como se muestra en la siguiente figura, se despliega un servidor GDS en cada nodo físico de un clúster para importar y exportar datos en paralelo. La velocidad de un solo nodo puede alcanzar los 700 MB/s.

Figura 3-1 Importación y exportación de datos en paralelo mediante GDS

    GDS puede trabajar conjuntamente con Foreign Data Wrapper (FDW), que permite el acceso a los datos de distintos clústeres, para migrar datos de un clúster a otro de forma rápida y sencilla. Como se muestra en la siguiente figura, GDS establece un canal de transferencia de datos entre dos clústeres. Los datos pueden exportarse desde el clúster de origen e importarse directamente al clúster de destino sin escribirse en discos.

Figura 3-2 Migración de datos entre clústeres

    Ventajas

  • Facilidad de uso. Los datos se pueden migrar ejecutando una sola instrucción SQL: INSERT INTO... SELECT... FROM... [WHERE];
  • Alto rendimiento: La potencia de cómputo de ambos clústeres se puede utilizar por completo.
  • Los datos no se escriben en los discos durante la migración, por lo que no ocupan espacio en disco.

    Uso

  • Migración de datos completa entre los clústeres de GaussDB(DWS)
  • Migración parcial de datos basada en condiciones de filtrado entre clústeres de GaussDB(DWS)