AI开发平台MODELARTS-AI CPU问题定位处理:ArgMin算子优化

时间:2024-04-30 18:09:26

ArgMin算子优化

ArgMin在CANN 6.3 RC2 版本上 算子下发到 AICPU执行,在 CANN 7.0RC1上下发到AI_CORE 上边执行。出现此类情形建议升级 CANN 包版本。

在 shape 大小是 (1024, 1024) 的 tensor 上测试,结果如下:

CANN 6.3.RC2上,单算子执行时间 2.603 ms。

图5 单算子执行时间(CANN 6.3.RC2)

CANN7.0 RC1上,单算子执行时间 223.516 us。

图6 单算子执行时间(CANN7.0 RC1)
support.huaweicloud.com/bestpractice-modelarts/modelarts_10_2517.html