MapReduce服务 MRS-Spark应用执行过程中,日志中一直打印getApplicationReport异常且应用较长时间不退出:回答

时间:2023-11-01 16:25:25

回答

在Spark中有个定期线程,通过连接RM监听AM的状态。由于连接RM超时,就会报上面的错误,且一直重试。RM中对重试次数有限制,默认是30次,每次间隔默认为30秒左右,每次重试时都会报上面的错误。超过次数后,driver才会退出。

RM中关于重试相关的配置项如表1所示。

表1 参数说明

参数

描述

默认值

yarn.resourcemanager.connect.max-wait.ms

连接RM的等待时间最大值。

900000

yarn.resourcemanager.connect.retry-interval.ms

重试连接RM的时间频率。

30000

重试次数=yarn.resourcemanager.connect.max-wait.ms/yarn.resourcemanager.connect.retry-interval.ms,即重试次数=连接RM的等待时间最大值/重试连接RM的时间频率。

在Spark客户端机器中,通过修改“conf/yarn-site.xml”文件,添加并配置“yarn.resourcemanager.connect.max-wait.ms”“yarn.resourcemanager.connect.retry-interval.ms”,这样可以更改重试次数,Spark应用可以提早退出。

support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_2009.html