Search_HUAWEI CLOUD

配置对接Kafka可靠性 - MapReduce服务 MRS

Kafka服务的topic的leader异常后，若Kafka的leader和follower的offset相差太大，用户重启Kafka服务，Kafka的follower和leader相互切换，则Kafka服务重启后，topic的offset变小。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Streaming企业级能力增强
配置Spark2x Web UI ACL - MapReduce服务 MRS

一种为已结束任务的Web UI，可以通过Spark2x JobHistory服务或者REST接口访问。本章节仅支持安全模式（开启了Kerberos认证）集群。运行中任务Web UI ACL配置。运行中的任务，可通过服务端对如下参数进行配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark用户权限管理
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

Spark SQL能自动处理数据倾斜场景，对倾斜的分区，启动多个task进行处理，每个task读取若干个shuffle输出文件，再对这部分任务的Join结果进行Union操作，以达到消除数据倾斜的效果配置参数登录FusionInsight Manager系统，选择“集群 > 服务

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
获取运行中Spark应用的Container日志 - MapReduce服务 MRS

获取运行中Spark应用的Container日志运行中Spark应用的Container日志分散在多个节点中，本章节用于说明如何快速获取Container日志。场景说明可以通过yarn logs命令获取运行在Yarn上的应用的日志，针对不同的场景，可以使用以下命令获取需要的日志

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因此

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
配置Yarn模式下Spark动态资源调度 - MapReduce服务 MRS

登录FusionInsight Manager，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置 > 全部配置”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能配置场景在Spark SQL多表Join的场景下，会存在关联键严重倾斜的情况，导致Hash分桶后，部分桶中的数据远高于其它分桶。最终导致部分Task过重，跑得很慢；其它Task过轻，跑得很快。一方面，数据量大Task运行慢，使得计算性能低

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能配置场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Spark SQL在不同DB都可以显示临时表 - MapReduce服务 MRS

Spark SQL在不同DB都可以显示临时表问题切换数据库之后，为什么还能看到之前数据库的临时表？创建一个DataSource的临时表，例如以下建表语句。 create temporary table ds_parquet using org.apache.spark.sql.parquet

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
健康检查时，误将JDBCServer Kill - MapReduce服务 MRS

健康检查时，误将JDBCServer Kill 问题健康检查方案中，在并发执行的语句达到线程池上限后依然会导致健康检查命令无法执行，从而导致健康检查程序超时，然后把Spark JDBCServer进程Kill。回答当前JDBCServer中存在两个线程池HiveServer2

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
连上不同的JDBCServer，function不能正常使用 - MapReduce服务 MRS

连上不同的JDBCServer，function不能正常使用问题场景一：通过add jar的方式建立永久函数，当Beeline连上不同的JDBCServer或者JDBCServer重启后都需要重新add jar。图1 场景一异常信息场景二： show functions能够查到相应的函数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项问题运行Spark Streaming任务时，随着executor个数的增长，数据处理性能没有明显提升，对于参数调优有哪些注意事项？回答在executor核数等于1的情况下，遵循以下规则对调优Spark Streaming

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
对同一目录创建多个外表，可能导致外表查询失败 - MapReduce服务 MRS

对同一目录创建多个外表，可能导致外表查询失败问题假设存在数据文件路径“/test_data_path”，用户userA对该目录创建外表tableA，用户userB对该目录创建外表tableB，当userB对tableB执行insert操作后，userA将查询tableA失败，出现

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题
新创建用户修改完密码后无法登录Ranger - MapReduce服务 MRS

新创建用户修改完密码后无法登录Ranger 问题使用新建用户登录Ranger页面，为什么在修改完密码后登录报401错误？回答由于UserSync同步用户数据有时间周期，默认是5分钟，因此在Manager上新创建的用户在用户同步成功前无法登录Ranger，因为Ranger的DB

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger常见问题
Hudi在upsert时占用了临时文件夹中大量空间 - MapReduce服务 MRS

Hudi在upsert时占用了临时文件夹中大量空间问题 Hudi在upsert时占用了临时文件夹中大量空间。回答当UPSERT大量输入数据时，如果数据量达到合并的最大内存时，Hudi将溢出部分输入数据到磁盘。如果有足够的内存，请增加spark executor的内存和添加“

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题 > 数据写入
使用Hcatalog方式同步Hive和MySQL之间的数据，timestamp和data类型字段会报错 - MapReduce服务 MRS

使用Hcatalog方式同步Hive和MySQL之间的数据，timestamp和data类型字段会报错问题使用Hcatalog方式同步Hive和MySQL之间的数据，timestamp和data类型字段会报错：回答调整Sqoop源码包中的代码，将timestamp强制转换类型和

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop > Sqoop常见问题
为什么在Ranger中删除用户权限后，该用户仍能够操作自己创建的任务 - MapReduce服务 MRS

处理步骤使用admin用户登录FusionInsight Manager，选择“集群 > 服务 > Ranger”，单击“RangerAdmin UI”右侧的超链接进入Ranger WebUI界面。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > CDL常见问题
创建HBase全局二级索引 - MapReduce服务 MRS

创建HBase全局二级索引场景介绍在用户的表中预先存在大量数据的情况下，可以在某个列上添加索引。对于未建立索引的用户表，该工具允许用户同时添加和构建索引。创建HBase全局二级索引在HBase客户端执行以下命令即可添加或创建索引，执行命令后，指定的索引将被添加到表中： hbase

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase全局二级索引提升查询效率
Spark yarn-client模式下如何修改日志级别为INFO - MapReduce服务 MRS

Spark yarn-client模式下如何修改日志级别为INFO 问题 Spark yarn-client模式下如何修改日志级别为INFO？回答登录Spark客户端节点，修改“{客户端安装目录}Spark/spark/conf/log4j.properties”配置文件，修改参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题
运行Flink任务报错“java.lang.NoSuchFieldError: SECURITY_SSL_ENCRYPT_ENABLED”如何处理？ - MapReduce服务 MRS

运行Flink任务报错“java.lang.NoSuchFieldError: SECURITY_SSL_ENCRYPT_ENABLED”如何处理？问： Flink任务运行失败，报错如下： Caused by: java.lang.NoSuchFieldError: SECURITY_SSL_ENCRYPT_ENABLED

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink常见问题

总条数： 6392

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消