架构全览带您深入了解ModelArts Guard
架构全览带您深入了解ModelArts Guard
.png)
为什么选择华为云ModelArts Guard
提示词攻击检测:抵御大模型新型攻击
支持单轮和多轮交互攻击手法,检出率>80%,误报率小于1%
支持多种攻击模式检测 (例:目标劫持、角色扮演、反面诱导、悖论攻击、初始肯定、GCG攻击等)

PII隐私内容脱敏:保障个人隐私数据安全
支持20+种个人识别数据检测和脱敏
支持身份证、电话、地址、护照、驾照等信息脱敏

内容审核:全面拦截敏感内容传播
支持文本审核,具有语言识别能力,主动识别变体等能力
支持图片审核,具有政治人物识别、画中画识别的能力,以及构建目标检测、识别、OCR等复杂的模型体系
