Doris数据变更规范 该章节主要介绍Doris数据变更时需遵循的规范和建议。 数据变更类 【强制】应用程序不可以直接使用delete或者update语句变更数据,可以使用CDC的upsert方式来实现。 低频操作上使用,比如Update几分钟更新一次。 如果使用Delete一定带上分区条件
Doris数据导入规范 该章节主要介绍Doris数据导入规范。 数据导入 【建议】在Flink实时写入数据到Doris的场景下,CheckPoint设置的时间需要考虑每批次数据量,如果每批次数据太小会造成大量小文件,推荐值为60s。 【建议】建议低频攒批导入数据,平均单表导入批次间隔需大于
Doris建表规范 该章节主要介绍Doris建表时需遵循的规范和建议。 建表规范 【强制】创建表指定分桶buckets时,每个桶的数据大小为应保持在100M-3G之间,单分区中最大分桶数据不超过5000。 【强制】表数据超过5亿条以上必须设置分区分桶策略。 【强制】分桶的列不要设置太多
添加租户 Doris的多租户管理,目的是为了多个用户在同一Doris集群内进行数据操作时,减少相互之间的干扰,能够将集群资源更合理的分配给各用户。且集成了租户生命周期管理、租户资源配置和租户资源使用统计等功能,为企业提供了成熟的多租户管理模型,实现集中式的租户和业务管理。 新建租户步骤
导入数据至Doris集群方式介绍 导入(Load)功能就是将用户的原始数据导入到Doris中。导入成功后,用户即可通过Mysql客户端查询数据。Doris支持多种导入方式。 支持数据源 Doris提供多种数据导入方案,可以针对不同的数据源选择不同的数据导入方式。 使用Broker
Doris集群磁盘扩容 磁盘扩容,即纵向扩容,是一种扩容节点内磁盘容量的操作。一般来说,具体的数据存储在BE节点,当BE节点磁盘容量不足时,业务数据将无法存储,因此需要对节点进行纵向扩容。 磁盘扩容过程中,集群业务可能存在抖动。 前提条件 当集群状态处于“服务中”,且没有任何任务操作
查看ClickHouse集群详情 集群创建完成后,可对集群进行监控和管理。在CloudTable管理控制台单击集群管理,在集群列表中找到所要查看的集群并单击集群名称,进入集群基本信息页面,用户可查看集群信息和集群的网络配置。 表1 集群信息 参数 说明 集群名称 集群的名称,创建集群时设置
ClickHouse数据迁移 本章节为您介绍数据迁移能力。 使用场景 ClickHouse集群节点扩容后,需要使用数据迁移对数据进行迁移。 注意事项 存在分区大于50GB的表不支持页面操作迁移,需要手工迁移。 迁移表需要非空,且设置唯一分区字段。空表或多字段分区在创建任务时无法选择
HBase集群磁盘扩容 磁盘扩容,即纵向扩容,是一种扩容节点内磁盘容量的操作。一般来说,具体的数据存储在计算节点,当计算节点磁盘容量不足时,业务数据将无法存储,因此需要对节点进行纵向扩容。 使用限制 当所有的Core节点磁盘占用90%时,集群异常且读写不可用。 当集群状态处于“服务中
租户命令简介 此章节主要介绍SQL基本语法和使用说明。 新增租户。 create workload group if not exists test_group properties ( "cpu_share"="10", "memory_limit"="30%
CloudTable HBase中如何查询某个表的创建时间? 在CloudTable中查询表的创建时间有如下方法: 创建新表的时候会显示在返回结果中。 连接集群,使用HBase Shell访问集群,具体操作请参见《用户指南》手册中的“使用HBase Shell访问集群”章节。 输入
HBase表每日存储的新增数据量怎么查看? 问题描述 HBase表每日存储的新增数据量怎么查看? 处理办法 HBase集群无法查看单个表的增量值,需要通过后台帮您查询,或者可以通过控制台查看每日新增数据,查看详情页已经使用的存储容量,通过记录存储容量值计算增量。 父主题: 数据读写类
创建Doris表时不返回结果如何处理? 问题现象 创建Doris表时不返回结果。 分析原因 Doris的建表命令是同步命令。该命令的超时时间目前设置的比较简单,即(tablet num*replication num)秒。如果创建较多的数据分片,并且其中有分片创建失败,则可能导致等待较长超时后
建立ClickHouse连接 功能介绍 创建连接时使用ClickHouseDataSource配置连接使用的url和属性。 然后使用clickhouse-example.properties配置的user和password作为认证凭据,ClickHouse会带着用户名和密码在服务端进行安全认证
创建ClickHouse库 功能介绍 如下示例中通过on cluster语句在集群的所有Server节点创建数据库。 其中数据库名定义在clickhouse-example.properties文件的databaseName字段。 样例代码 private void createDatabase
创建ClickHouse表 功能介绍 如下示例中通过on cluster语句在集群的所有Server节点创建分布式表和本地表。 createSql为本地表,createDisSql为基于本地表的分布式表。 样例代码 private void createTable(String databaseName
插入ClickHouse数据 功能介绍 如下示例代码通过循环batchNum次,构造示例数据并通过PreparedStatement的executeBatch()方法批量插入数据。 其中数据类型为创建的表所指定的三个字段,分别是String、UInt8和Date类型。 样例代码 String
查询ClickHouse数据 功能介绍 查询语句1:querySql1查询创建表创建的tableName表中任意10条数据; 查询语句2:querySql2通过内置函数对创建表创建的tableName表中的日期字段取年月后进行聚合。 样例代码 private void queryData
删除ClickHouse表 功能介绍 删除在创建表中创建的副本表和分布式表。 语句1:使用drop table将集群中的本地表删除。 语句2:使用drop table将集群中的分布式表删除。 样例代码 private void dropTable(String databaseName
配置HBase多语言访问 操作场景 用户根据指定的host和port访问对应的ThriftServer实例,进行HBase表的创建,删除等操作。 前提条件 集群已启用ThriftServer并从集群详情页面获取到ThriftServer IP。 已下载Thrift安装包,安装包下载地址