Search_HUAWEI CLOUD

HBase开源增强特性 - MapReduce服务 MRS

HBase开源增强特性 HBase开源增强特性：HIndex HBase是一个Key-Value类型的分布式存储数据库。每张表的数据按照RowKey的字典顺序排序，因此，如果按照某个指定的RowKey去查询数据，或者指定某一个RowKey范围去扫描数据时，HBase可以快速定位到需要读取的数据位置

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
TABLESAMPLE - MapReduce服务 MRS
TABLESAMPLE - MapReduce服务 MRS

TABLESAMPLE 有BERNOULLI和SYSTEM两种采样方法。这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引场景介绍为了快速对数据创建索引，HBase提供了可通过MapReduce功能创建索引的TableIndexer工具，该工具可实现添加、构建和删除索引。具体使用场景如下：在表中预先存在大量数据的情况下，可能希望在某个列上添加索引

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引场景介绍为了快速对数据创建索引，HBase提供了可通过MapReduce功能创建索引的TableIndexer工具，该工具可实现添加、构建和删除索引。具体使用场景如下：在表中预先存在大量数据的情况下，可能希望在某个列上添加索引

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
Yarn运维管理 - MapReduce服务 MRS
Yarn运维管理 - MapReduce服务 MRS

Yarn运维管理 Yarn常用配置参数 Yarn日志介绍登录Yarn WebUI界面查看作业状态配置Yarn本地化日志级别检测Yarn内存使用情况更改NodeManager的存储目录配置Yarn大作业扫描父主题：使用Yarn

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn
启用/禁用HBase二级索引 - MapReduce服务 MRS

启用/禁用HBase二级索引功能介绍您可以使用org.apache.hadoop.hbase.hindex.client.HIndexAdmin中提供的方法来管理HIndexes。这个类提供了启用/禁用现有索引的方法。根据用户是否想要启用/禁用表，HIndexAdmin提供以下

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x及之前） > HBase开发指南 > 开发HBase应用
Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

Hive使用WHERE条件查询超过3.2万分区的表报错问题： Hive创建超过3.2万分区的表，执行带有WHERE分区的条件查询时出现异常，且“metastore.log”中打印的异常信息包含以下信息： Caused by: java.io.IOException: Tried

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

Hive使用WHERE条件查询超过3.2万分区的表报错问题 Hive创建超过3.2万分区的表，执行带有WHERE分区的条件查询时出现异常。 “metastore.log”中打印的异常信息包含以下信息： Caused by: java.io.IOException: Tried to

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
Doris支持审计日志表功能 - MapReduce服务 MRS

Doris支持审计日志表功能 Doris审计日志表功能支持将FE的审计日志定期通过Stream Load导入到指定的Doris表中，方便用户直接通过执行SQL语句对审计日志进行查看和分析，无需再通过查看FE的审计日志文件去统计并分析业务量、业务类型等。Doris审计日志表功能默认是关闭的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris运维管理
添加HBase数据源 - MapReduce服务 MRS

添加HBase数据源本章节指导用户在HSConsole界面添加HBase数据源。添加HBase数据源前提条件数据源所在集群域名与HetuEngine集群域名不能相同。数据源所在集群与HetuEngine集群节点网络互通。在HetuEngine所在集群的所有节点的“/etc

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能配置场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

小文件优化操作场景 Spark SQL表中，经常会存在很多小文件（大小远小于HDFS的块大小），每个小文件默认对应Spark中的一个Partition，即一个Task。在有很多小文件时，Spark会启动很多Task，此时当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能操作场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

小文件优化操作场景 Spark SQL表中，经常会存在很多小文件（大小远小于HDFS的块大小），每个小文件默认对应Spark中的一个Partition，即一个Task。在有很多小文件时，Spark会启动很多Task，此时当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Hive大SQL任务异常如何定位 - MapReduce服务 MRS

Hive大SQL任务异常如何定位现象描述 MRS 3.5.0-LTS及之后版本，Hive执行的大SQL导致HiveServer或MetaStore内存快速增长，频繁Full GC使得业务无法正常运行，甚至导致实例异常重启。原因分析查询大字段表导致HiveServer内存异常。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Hudi Compaction操作说明 - MapReduce服务 MRS

Hudi Compaction操作说明 Compaction用于合并mor表Base和Log文件。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > 数据管理维护
Impala应用开发规则 - MapReduce服务 MRS

Impala应用开发规则创建集群时只需指定一个Catalog和一个StoreStore 如果已经创建了两个Catalog和StateStore，Impalad角色需要指定--catalog_service_host和--state_store_host，Catalog角色需要指定

 帮助中心 > MapReduce服务 MRS > 组件开发规范 > Impala应用开发规范
Hudi Compaction操作说明 - MapReduce服务 MRS

Hudi Compaction操作说明 Compaction用于合并mor表Base和Log文件。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
创建HBase索引进行数据查询 - MapReduce服务 MRS

创建HBase索引进行数据查询操作场景 HBase是一个Key-Value类型的分布式存储数据库，HIndex为HBase提供了按照某些列的值进行索引的能力，缩小搜索范围并缩短时延。使用约束列族应以“;”分隔。列和数据类型应包含在“[]”中。列数据类型在列名称后使用“->

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase数据操作
Impala应用开发建议 - MapReduce服务 MRS

Impala应用开发建议 Coordinator和Executor分离部署，Coordinator根据集群规模部署2-5个 Coordinator承担缓存元数据，解析SQL执行计划，和响应客户端请求的功能主要使用jvm内存，而Executor承担数据读写，算子计算等功能，主要使用offheap

帮助中心 > MapReduce服务 MRS > 组件开发规范 > Impala应用开发规范

总条数： 124

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消