数据仓库服务 GAUSSDB(DWS)-OBS上的数据准备:操作场景

时间:2023-11-22 14:18:37

操作场景

使用SQL on OBS功能查询OBS数据之前:

  1. 已将ORC数据存储在OBS上。

    例如,在使用Hive或Spark等组件时创建了ORC表,其表数据已经存储在OBS上的场景。

    假设有2个ORC数据文件“product_info.0”“product_info.1”,其原始数据如原始数据所示,都已经存储在OBS桶“mybucket”“demo.db/product_info_orc/”目录中。

  2. 如果数据文件已经在OBS上了,请执行获取源数据的OBS路径并设置读取权限中的步骤。

    本小节以导入ORC格式为例,PARQUET、CARBONDATA、JSON数据的导入方法与ORC格式相似。

    该方式同样也支持导入TEXT、CSV格式文件,但由于该方式不支持错误表,因此推荐使用从OBS导入CSV、TEXT数据(方式一)的导入方式。

support.huaweicloud.com/devg-820-dws/dws_04_0243.html