AI开发平台MODELARTS-使用自定义数据集进行训练:Step6 提交ModelArts训练作业

时间:2024-05-17 17:20:04

Step6 提交ModelArts训练作业

  1. 参考Step2,修改外壳的配置文件
    1. 填写OBS桶信息
      obs_bucket = 'obs://my_bucket/my_object'
    2. 按需修改runner里的Adapter参数。
          adapter=dict(
              requirements=f'{work_dir}/algorithm/requirements.txt',
      
              framework_type='PyTorch',
              framework_version='PyTorch-1.4.0-python3.6',
              instance_type='modelarts.p3.large.public',
              pool_id=None,
      
              downloads=dict(
                  src=[f'{obs_bucket}/{alg_cfg["data_root"]}',
                       f'{obs_bucket}/{alg_cfg["pretrained"]}'],
                  dst=[alg_cfg['data_root'], alg_cfg['pretrained']],
              ),
              uploads=dict(
                  src=[run_dir],
                  dst=[f'{obs_bucket}/{run_dir}'],
              ),
          ),
  2. 在Terminal中输入下述命令来提交ModelArts训练作业完成训练。
    python manage.py run --launch_remote --cfg algorithms/ivgPose/config/sample/config.py --gpus 0 

    提交完训练作业后,可以在ModelArts控制台交互式界面看到当前训练作业的状态(如排队中、运行中等),可以在config.py配置的{run_dir}/{训练作业名称目录}下看到ModelArts上的训练日志。

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0178.html