自动驾驶云服务 OCTOPUS-训练任务:训练任务日志查看和下载

时间:2024-05-11 16:52:48

训练任务日志查看和下载

训练任务运行的过程中生成日志,训练任务模块提供了日志的查看以及下载功能,支持用户查看训练任务的运行情况。训练任务生成的日志文件有以下四种:

  • train-{id}-{index}.log:用户实际训练任务的训练日志。
  • train-{id}-{index}-init.log:Octopus平台提供的前置数据的准备日志。
  • train-{id}-{index}-sidecar.log:Octopus平台提供的任务流程控制日志,包括日志同步、结果上传。
  • octopus-train-{id}-{index}-supplemental.logs: Octopus平台任务异常退出或停止产生的错误信息输出日志,运行正常时不产生该日志。

    {id}为该训练任务ID,{index}为节点编号,例如单节点single-0,多节点distributed-0 distributed-1。

详情页,单击“任务日志”,可查看该训练任务日志详情。支持在线浏览或下载至本地。如果日志较多,用户可在搜索框中输入关键字,查找指定日志内容。

图6,在日志服务页面中的日志列表部分详细展示了该训练任务包含的日志文件的大小以及最近写入时间。单击文件后的“查看”,算法训练的详细执行过程会在日志详情部分展示。用户也可在日志文件后的“操作”栏中,单击“下载”,即可将该日志文件下载到本地查看。

图6 日志文件
support.huaweicloud.com/usermanual-octopus/octopus-07-0006.html