盘古大模型 PANGULARGEMODELS-查看提示词评估结果
时间:2025-06-06 14:26:15
查看提示词评估结果
- 评估任务创建完成后,会跳转至“评估”页面,在该页面可以查看评估状态。
图1 查看提示词评任务状态
- 单击“评估名称”,进入评估任务详情页,可以查看详细的评估进度,例如在图2中有10条评估用例,当前已评估8条,剩余2条待评估。
- 评估完成后,可以查看每条数据的评估结果。
在评估结果中,“预期结果”表示变量值(问题)所预设的期望回答,“生成结果”表示模型回复的结果。通过比对“预期结果”、“生成结果”的差异可以判断提示词效果。
父主题: 批量评估提示词效果
support.huaweicloud.com/usermanual-pangulm/pangulm_04_0133.html