AI开发平台MODELARTS-附录:大模型推理常见问题:问题4:使用SmoothQuant进行W8A8进行模型量化时报错

时间:2025-04-09 09:16:49

问题4:使用SmoothQuant进行W8A8进行模型量化时报错

使用SmoothQuant进行W8A8进行模型量化时报错:AttributeError: type object 'LlamaAttention' has no attribute '_init_rope'

解决方法:降低transformers版本到4.42

pip install transformers==4.42 --upgrade
support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_infer_91136.html
提示

您即将访问非华为云网站,请注意账号财产安全