数据仓库服务 GAUSSDB(DWS)-OBS上的数据准备:操作场景
操作场景
使用SQL on OBS功能查询OBS数据之前:
- 已将ORC数据存储在OBS上。
例如,在使用Hive或Spark等组件时创建了ORC表,其表数据已经存储在OBS上的场景。
假设有2个ORC数据文件“product_info.0”和“product_info.1”,其原始数据如原始数据所示,都已经存储在OBS桶“mybucket”的“demo.db/product_info_orc/”目录中。
- 如果数据文件已经在OBS上了,请执行获取源数据的OBS路径并设置读取权限中的步骤。
本小节以导入ORC格式为例,PARQUET、CARBONDATA、JSON数据的导入方法与ORC格式相似。
该方式同样也支持导入TEXT、CSV格式文件,但由于该方式不支持错误表,因此推荐使用从OBS导入CSV、TEXT数据(方式一)的导入方式。
- 数据仓库服务GaussDB(DWS)_SQL on Anywhere
- DWS安全_数据仓库服务安全_DWS数据安全管理_DWS安全保障_DWS安全策略
- 调用GaussDB(DWS) API接口_数据仓库服务调用API_如何调用API_在DWS中调用API
- DWS产品介绍_DWS产品优势_DWS功能_DWS使用场景_DWS是什么
- GAUSS(DWS)工具_gsql工具_DataStudio工具_DSC工具
- GaussDB(DWS)常用SQL_常用SQL命令_SQL语法
- GaussDB数据库上云_GaussDB怎么读_华为高斯数据库上云
- DWS资源管理_GaussDB(DWS)资源管理作用_DWS资源管控
- 数据库监控DMS_数据库智能运维_了解Auto Pilot_DMS_DWS节点监控
- 如何进行日志采集和转储_日志平台_日志接入_日志转储