MapReduce服务 MRS-网络连接超时导致FetchFailedException:回答

时间:2023-11-01 16:25:25

回答

在运行应用程序时,使用Executor参数“--executor-cores 4”,单进程中并行度高导致IO非常繁忙,以至于任务运行缓慢。

16/02/26 10:04:53 INFO TaskSetManager: Finished task 2139.0 in stage 1.0 (TID 151149) in 376455 ms on 10-196-115-2 (694/153378)

单个任务运行时间超过6分钟,从而导致连接超时问题,最终使得任务失败。

将参数中的核数设置为1,“--executor-cores 1”,任务正常完成,单个任务处理时间在合理范围之内(15秒左右)。

16/02/29 02:24:46 INFO TaskSetManager: Finished task 59564.0 in stage 1.0 (TID 208574) in 15088 ms on 10-196-115-6 (59515/153378)

因此,处理这类网络超时任务,可以减少单个Executor的核数来规避该类问题。

support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_2007.html