搜索_华为云

Kudu应用开发简介 - Kudu应用开发概述 - MapReduce服务 MRS

与Apache Impala的紧密集成，使其成为将HDFS与Apache Parquet结合使用的更好选择。提供强大而灵活的一致性模型，允许您根据每个请求选择一致性要求，包括用于严格可序列化的一致性的选项。提供同时运行顺序读写和随机读写的良好性能。易于管理。高可用性。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > Kudu应用开发概述
Kudu应用开发简介 - Kudu应用开发概述 - MapReduce服务 MRS

与Apache Impala的紧密集成，使其成为将HDFS与Apache Parquet结合使用的更好选择。提供强大而灵活的一致性模型，允许您根据每个请求选择一致性要求，包括用于严格可序列化的一致性的选项。提供同时运行顺序读写和随机读写的良好性能。易于管理。高可用性。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > Kudu应用开发概述
Kudu - MapReduce服务 MRS
Kudu - MapReduce服务 MRS

集成与Apache Impala的紧密集成，使其成为将HDFS与Apache Parquet结合使用的更好选择提供强大而灵活的一致性模型，允许您根据每个请求选择一致性要求，包括用于严格可序列化的一致性的选项提供同时运行顺序读写和随机读写的良好性能易于管理高可用性。Mas

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Hudi表概述 - 使用Hudi - MapReduce服务 MRS

写时复制表也简称cow表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
Hudi表概述 - 使用Hudi - MapReduce服务 MRS

写时复制表也简称cow表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
配置Hudi历史数据清理 - MapReduce服务 MRS

描述 table_name 待删除数据的表名，支持database.tablename格式 delete statement select类型的sql语句，用于找出待删除的数据示例从mytable表中删除primaryKey < 100 的所有数据： call clean_data(table

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
ClickHouse简介 - ClickHouse应用开发简介 - MapReduce服务 MRS

ClickHouse简介 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse的设计优点：数据压缩比高多核并行计算向量化计算引擎支持嵌套数据结构

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > ClickHouse应用开发简介
ClickHouse应用开发简介 - ClickHouse开发指南（安全模式） - MapReduce服务 MRS

荐使用社区版本的clickhouse-jdbc来进行应用程序开发。基本概念 cluster cluster（集群）在ClickHouse里是一种逻辑的概念，它可以由用户根据需要自由地定义，与通常理解的集群有一定的差异。多个ClickHouse节点之间是一种松耦合的关系，各自独立存在。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（安全模式）
ClickHouse简介 - ClickHouse应用开发简介 - MapReduce服务 MRS

ClickHouse简介 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse的设计优点：数据压缩比高多核并行计算向量化计算引擎支持嵌套数据结构

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（安全模式） > ClickHouse应用开发简介
快速开发ClickHouse应用 - MapReduce服务 MRS

模、数百以上的维度的大宽表，随时进行个性化统计和持续探索式查询分析，辅助商业决策，具有非常好的查询体验。 MRS对外提供了ClickHouse JDBC的应用开发样例工程，本实践用于指导您创建MRS集群后，获取并导入样例工程并在本地进行编译调测，用于实现MRS集群中的ClickH

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
ClickHouse应用开发简介 - ClickHouse开发指南（普通模式） - MapReduce服务 MRS

荐使用社区版本的clickhouse-jdbc来进行应用程序开发。基本概念 cluster cluster（集群）在ClickHouse里是一种逻辑的概念，它可以由用户根据需要自由地定义，与通常理解的集群有一定的差异。多个ClickHouse节点之间是一种松耦合的关系，各自独立存在。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（普通模式）
如何通过集群外的节点访问MRS集群？ - MapReduce服务 MRS

如何通过集群外的节点访问MRS集群？创建集群外Linux操作系统ECS节点访问MRS集群创建一个集群外ECS节点，具体请参考购买弹性云服务器。 ECS节点的“可用区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。在VPC管理控制台，申请一个弹性IP地址，并与ECS绑定。

帮助中心 > MapReduce服务 MRS > 常见问题 > 集群管理类
查看MRS集群运行状态 - MapReduce服务 MRS

现有集群：包括除了“失败”和“已删除”状态以外的所有集群。历史集群：仅包含“已删除”的集群，目前界面只显示6个月内创建且已删除的集群，若需要查看6个月以前删除的集群，请联系华为云支持人员。失败任务管理：单击可查看“失败”状态的集群创建任务。表1 集群列表参数参数参数说明名称/ID 集群的名称，创建集群

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群
配置流式读取Spark Driver执行结果 - Spark Core企业级能力增强 - MapReduce服务 MRS

uselocalFileCollect开启的情况下生效。直接序列化的方式，还是间接序列化的方式保存结果数据到磁盘。优点：针对分区数特别多的表查询结果汇聚性能优于直接使用结果数据保证在磁盘的方式。缺点：和spark.sql.uselocalFileCollect开启时候的缺点一样。 true：使用该功能

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
Flink任务开发规则 - MapReduce服务 MRS

changelog与CDC格式的数据类似，只不过存储的方式不同，CDC格式数据会将更新前和更新后的数据在一行记录，而changelog数据会将更新数据拆分成两行，一行是对更新前数据的删除操作，一行是更新后的数据插入操作记录。Flink在计算的时候会将基于更新数据的聚合结果删除，再将基于更新后数据的计算结果插入。ch

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
配置流式读取Spark Driver执行结果 - Spark Core企业级能力增强 - MapReduce服务 MRS

uselocalFileCollect开启的情况下生效。直接序列化的方式，还是间接序列化的方式保存结果数据到磁盘。 true：JDBCServer的查询结果将汇聚到本地文件上采用Hive的数据格式。优点：针对分区数特别多的表查询结果汇聚性能优于直接使用结果数据保证在磁盘的方式。缺点：和spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
确定表类型 - MapReduce服务 MRS
确定表类型 - MapReduce服务 MRS

确定表类型表类型优点缺点优选场景 mor 写得快，增量数据写log文件。读得慢，读时合并log文件和parquet文件。需要定期执行表服务维护操作Compaction/Clean/Archive，否则mor表读的越来越慢。 spark/flink(migration实时任务)流场景，实时写入。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > SparkOnHudi场景操作指导
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

写时复制表也简称cow表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Hudi表索引设计规范 - Flink on Hudi开发规范 - MapReduce服务 MRS

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bucket桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范
Hudi表索引设计规范 - Hudi数据表设计规范 - MapReduce服务 MRS

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bucket桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范

总条数： 2709

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消