AI开发平台ModelArts-日志提示“UnboundLocalError: local variable 'epoch'”:处理方法

时间:2023-11-01 16:25:38

处理方法

第二次增量训练设置的epochs数值需要大于第一次常规训练设置的epochs数值。

举例:对一个已经完成的训练作业(假设训练了50个epochs),想要训练更多的epochs(追加30个epochs),假设上一个训练作业的输出目录为“obs://my_bucket/train_url”,则设置参数“checkpoint_url=obs://my_bucket/train_url/last.pt”,并设置参数epochs=80(如果第二次设置参数epochs=30则增量训练只会训练29个epochs)。

support.huaweicloud.com/trouble-modelarts/modelarts_trouble_0062.html