5步快速使用云数据仓库
5步快速使用云数据仓库
01 注册华为云并实名认证
打开华为云网站,单击”注册“,根据提示信息完成注册,注册成功后,按指引完成个人或企业实名认证。
02 创建集群
针对不同分析场景和业务规模,可以选择标准数仓、实时数仓和IoT数仓,并选择合适的数据存储容量。为了保证业务连接无单点断连风险,需搭配弹性负载均衡ELB一起使用。
03 连接集群
支持使用SQL客户端工具或者JDBC(Java database connectivity)/ODBC(Open Database Connectivity)等第三方驱动程序连接集群,访问集群中的数据库。
04 导入数据
支持多种数据源和导入工具完成数据入库:支持OBS外表、GDS外表导入;支持CDM、DRS、DLI实时入库;支持访问远端MRS数据源;支持元数据导入和导出;支持DSC进行SQL脚本迁移等等。
05 数据分析
导入数据后,通过SQL命令完成各种业务场景数据分析。
最佳实践
最佳实践
数据迁移实践
Oracle迁移、MySQL实时同步、Kafka实时写入DWS。
表设计调优实践
介绍如何设计GaussDB(DWS)表结构(包括选择表存储方式、压缩级别、分布方式、分布列以及使用分区表和局部聚簇等),从而实现表性能的优化。
SQL查询优秀实践
根据数据库的SQL执行机制以及大量的实践总结发现:通过一定的规则调整SQL语句,在保证结果正确的基础上,能够提高SQL执行效率。
分区自动管理优秀实践
GaussDB(DWS) 引入了分区自动管理特性。可通过设置表级参数period、ttl开启分区自动管理功能,使分区表可以自动创建新分区和删除过期分区,降低分区表的维护成本,改善查询性能。
快速创建时序表
讲解如何快速创建适合自己业务的时序表,并对时序表进行分区管理,从而真正发挥时序表的优势。
资源管理实践
演示GaussDB(DWS)的资源管理功能,帮助企业客户解决数据分析过程中,多用户查询作业遇到的性能瓶颈,最终实现多用户执行SQL作业互不影响,节省资源消耗。