内容审核 Moderation

大模型安全护栏 ModelArts Guard

架构全览带您深入了解ModelArts Guard

架构全览带您深入了解ModelArts Guard

ModelArts Guard

借助大模型持续提升原子服务核心竞争力,从“感知”到“认知”。

升级价值
文本识别精度高

借助大模型(LLM/多模态大模型)对数据有效的意图理解能力,可以提高对图片或文本中敏感内容的精确识别,提高审核的准确率,减少漏杀/误杀。

图像识别准确率高

基于预训练模型(视觉大模型),提高目标检测、图像分类任务中敏感元素的识别准确率。


为什么选择华为云ModelArts Guard

提示词攻击检测:抵御大模型新型攻击

提示词攻击检测:抵御大模型新型攻击

  • 支持单轮和多轮交互攻击手法,检出率>80%,误报率小于1%

  • 支持多种攻击模式检测 (例:目标劫持、角色扮演、反面诱导、悖论攻击、初始肯定、GCG攻击等)

PII隐私内容脱敏:保障个人隐私数据安全

PII隐私内容脱敏:保障个人隐私数据安全

  • 支持20+种个人识别数据检测和脱敏

  • 支持身份证、电话、地址、护照、驾照等信息脱敏

内容审核:全面拦截敏感内容传播

内容审核:全面拦截敏感内容传播

  • 支持文本审核,具有语言识别能力,主动识别变体等能力

  • 支持图片审核,具有政治人物识别、画中画识别的能力,以及构建目标检测、识别、OCR等复杂的模型体系

荣誉与认证