AI开发平台MODELARTS-SD1.5基于DevServer适配PyTorch NPU的Finetune训练指导(6.3.T041):Step5 启动训练服务

时间:2024-06-17 17:57:10

Step5 启动训练服务

train_text_to_image_0304.py是训练的核心代码,通过stable_diffusers_train.sh来启动。
sh stable_diffusers_train.sh

如果启动前配置采用的是•可以参考解压出来的default_config...方式指定配置文件,就是在此stable_diffusers_train.sh脚本中增加--config_file=xxx.yaml参数。

刚开始会报一些Warning,可忽略。正常启动如下图所示,出现Steps: 1%字样。

图4 启动服务

如果启动过程中报SSL相关错误,如下图所示。

图5 启动过程中报SSL相关错误

修改相应路径下的/home/ma-user/anaconda3/envs/PyTorch-2.1.0/lib/python3.9/site-packages/requests/sessions.py文件,将self.verify的值由True改成False,如下图所示。

图6 修改self.verify参数值
support.huaweicloud.com/bestpractice-modelarts/modelarts_10_1502.html