AI开发平台MODELARTS-附录:大模型推理常见问题:问题13:使用SmoothQuant做权重转换时报错

时间:2025-04-09 09:16:49

问题13:使用SmoothQuant做权重转换时报错

图8 权重转换报错

涉及模型:qwen2-1.5b, qwen2-0.5b

解决方法:修改AscendCloud/AscendCloud-LLM/llm_tools/AutoSmoothQuant/autosmoothquant/examples/smoothquant_model.py中的main函数,保存模型时将safe_serialization指定为False

int8_model.save_pretrained(output_path,safe_serialization=False)
support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_infer_91136.html
提示

您即将访问非华为云网站,请注意账号财产安全