华为云用户手册

  • 技能 Agent的核心能力源于其技能体系,开发者可通过集成插件、设计工作流等方式不断扩展模型的功能范围。 表2 Agent平台技能 功能 说明 插件 您可以通过 API 无缝连接各类平台和服务,快速扩展智能体的功能,平台提供了丰富的内置插件,开箱即用;同时也支持自定义插件开发,将任意API封装成工具,灵活调用。更多信息,参考插件介绍。 知识库 提供开箱即用的企业级RAG服务,覆盖管理、测试、检索策略配置全功能。 工作流 工作流是构建复杂功能逻辑的可视化工具,通过灵活组合多个任务节点,能够设计多步骤的自动化流程,从而显著增强智能体应对复杂任务的能力。更多信息,参考工作流介绍。
  • 设置plog日志 登录承载租户账户后,在左侧菜单页选择平台配置模块,并切换至运维配置页签。 点击添加按钮,在添加弹窗中将模块设置为训练,名称(config_key)设置为plog_level。 设置项目ID,其默认状态下是defalut,此默认状态表示为所有的项目设置plog日志级别,该字段支持填写项目id为其单独设置plog日志级别。 设置资源池,该项选择全局,表示为所有资源池设置plog日志级别;选择单个后,需要输入资源池ID,用于对资源池单独设置plog日志级别。 上述设置完成后,设置plog日志级别,详细说明参考获取训练日志。 完成设置后,查看plog日志并基于日志内容排查训练问题参考 表2 设置plog日志 参数类别 参数名称 说明 高级设置 plog日志 开启后plog日志功能,会记录模型训练过程中的执行过程、状态、错误等信息,盘古技术支持人员可通过plog日志定位模型训练问题。训练任务开始后可以在承载租户的OBS桶中查看。plog日志分级如下: DEBUG:记录模型训练过程中代码的执行流、变量状态、参数的变化等。 INFO:记录模型训练过程中的运行信息,通常包括一些重要的状态变化、执行的关键步骤、模型训练进度等。 WARNING:记录模型训练过程中的告警信息,可用于识别潜在的问题或异常情况。 ERROR:记录模型训练过程中的执行错误信息。
  • 变量聚合节点 变量聚合节点能够对多个分支的输出进行聚合处理,方便后置节点统一配置。 如果工作流中设计了多个分支,往往需要一个节点来汇总所有分支的输出结果。在这种场景下,你可以使用变量聚合节点聚合多路分支的输出变量,变量聚合节点会读取多路分支中第一个不为空的值,供流程下游的节点使用和操作,不用额外处理未运行分支的输出结果,简化了数据流的管理。 变量聚合节点为可选节点,若无需配置,可跳过该步骤。 变量聚合节点配置步骤如下: 拖动左侧“变量聚合”节点至画布中,单击该节点以打开节点配置页面。 参照表1,完成变量聚合节点的配置。 表1 变量聚合节点配置说明 配置类型 参数名称 参数说明 配置示例(按场景写) 参数配置 输出参数 参数名称:固定为 Group1,如果有多个分组则根据分组数量递增为 Group2、Group3 等。 参数类型:取决于对应聚合分组的变量数据类型。 / 聚合策略 - 通过指定策略对每个分组中的所有变量进行聚合处理,同一组内的变量实施相对应的聚合策略。 目前聚合策略仅支持设置为“返回每个分组中第一个非空值”,支持拖动变量、调整变量位置。例如组内按顺序设置三个变量 output1、output2 和 output3,将其聚合为一个变量 Group1,如果 ouput1 不为空,则用 output1 的值为 Group1 赋值;如果 ouput1 为空,则取 ouput2 的值,依次类推。 目前聚合策略仅支持设置为“返回每个分组中第一个非空值”。 聚合分组 - 默认只有一个分组 Group1,对应一个输出变量 Group1。分组中所有变量类型相同。如果需要输出多个变量,可以添加多个分组,依次递增为 Group2、Group3等。 / 聚合变量 - 在聚合分组中选择需要聚合的变量,每个分组只能聚合一种数据类型的变量。例如将多个 String 类型的变量聚合为一个 String 变量、将多个 Integer 类型的变量聚合为一个 Integer 变量。 例如判断节点或意图识别节点会将工作流拆分为多路分支,每次执行时,工作流会根据判断条件或用户意图决定运行其中某一个分支,此时未执行的其他分支输出变量为空。你可以将多路分支都连接到变量聚合节点,并设置一个输出变量。无论哪条分支被执行,其结果都能通过这个变量被引用与访问,避免了下游节点对相同语义输出变量的重复定义。 图1 变量聚合节点配置示例 节点配置完成后,单击“确定”。 连接变量聚合节点和其他节点。 父主题: 工作流节点配置参考
  • 大模型节点 大模型节点提供了使用大模型的能力,可在节点中配置已部署的模型,用户可以通过编写Prompt、设置参数让模型处理相应任务。 大模型节点为可选节点,若无需配置,可跳过该步骤。 大模型节点配置步骤如下: 拖动左侧“大模型”节点至画布中,单击该节点以打开节点配置页面。 参照表1,完成大模型节点的配置。 表1 大模型节点配置说明 配置类型 参数名称 参数说明 参数配置 输入参数 配置大模型处理需要的输入参数值, 这些值会动态的添加到提示词中, 默认设置的输入参数名为 query。 参数名称:只允许输入字母、数字、下划线,且不能以数字开头。 类型、值:支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点的输出参数。 输入:将用户自定义的内容传递给大模型,设置为输入模式后, 无论前置节点产生什么输出内容,都不会传递给大模型。 输出参数 该参数用于解析大模型节点的输出,并提供给后序节点的输出参数引用。 参数名称:参数的名称长度必须大于等于1个字符,并且字符只允许为下面三种类型: 字母(A-Z或a-z) 数字(0-9) 特殊字符:_ 说明: 用户自定义输出参数名称不允许与内置输出参数rawOutput同名。大模型节点有一个内置输出参数rawOutput,代表该节点未经解析的原始输出,与大模型节点相连的后序节点可以直接引用该输出。 参数类型:输出参数的类型,可选String、Integer、Number、Boolean。 描述:对于该输出参数的描述。 输出格式:支持输出的格式包括文本、Markdown、JSON。 文本:大模型原始内容输出,仅支持一个参数,默认为raw_output, 支持修改名称; Markdown:期望模型输出markdown格式内容时选择。仅支持一个参数,默认为raw_output, 支持修改名称; JSON:要求模型按Json格式响应;支持添加多个参数; 模型配置 模型选择 选择模型接入模块已配置的大语言模型。 核采样 模型在输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到核采样值,核采样值可以限制模型选择这些高概率的词汇,从而控制输出内容的多样性。建议不要与温度同时调整。 温度 用于控制生成结果的随机性。调高温度,会使得模型的输出更具多样性和创新性;降低温度,会使输出内容更加遵循指令要求,但同时也会减少模型输出的多样性。 提示词配置 提示词 配置输入给大模型的提示词,用于指导模型更好的完成任务。配置提示词时,支持使用{{variable}}格式引用当前节点输入参数中已定义好的参数。最终替换后的内容会传递给模型。 记忆 是否打开记忆功能;打开后可记录多轮对话的内容,默认关闭。 图1 大模型节点配置示例 节点配置完成后,单击“确定”。 连接大模型节点和其他节点。 父主题: 工作流节点配置参考
  • 管理加工任务资源 与 MRS 相关的加工任务、发布任务在创建时,可以进行任务资源的参数配置,具体的参数可见表1 任务资源参数清单 表1 任务资源参数清单 参数名称 参数描述 executorCores Spark应用每个Executor的CPU核数。 numExecutors Spark应用Executor的个数。 executorMemory Spark应用的Executor内存,参数配置例如:2G,2048M。 driverCores Spark应用Driver的CPU核数。该配置项会替换“sc_type”中对应的默认参数。 driverMemory Spark应用的Driver内存,参数配置例如:2G,2048M。 父主题: 加工数据集
  • 提问器节点 提问器节点为开发者提供了收集用户问题所需信息的功能。该节点会循环执行,直到收集到所有必需的信息为止。 提问器节点为可选节点,若无需配置,可跳过该步骤。 提问器节点配置步骤如下: 拖动左侧“提问器”节点至画布中,单击该节点以打开节点配置页面。 参照表1,完成提问器节点的配置。 表1 提问器节点配置说明 配置类型 参数名称 参数说明 模式偏好 效果优先:效果优先模式下,会开启时间增强和反思功能,提参成功率更高,时延会增加。 时间增强:需要提取时间时,可以将自然语言的时间日期提取为YYYY-MM-DD HH:MM:SS标准格式的时间日期,比如:明天 12:30,提取为 2024-04-13 13:30:00 反思功能:数据提取之后,会让模型再判断一下是否提取正确,格式是否满足要求,不满足会尽量做一些修正。比如:期望提取电话号码,用户输入:我不记得电话号码,提取出:189******,反思后会认为提取不正确,会继续追问 速度优先:速度优先模式下时延最低,提参成功率可能无法保障速度优先模式下不开启时间增强和反思功能。 模型配置 模型选择 选择执行此节点的模型,支持设置模型在此节点中的生成多样性等参数配置,使模型效果更符合你的预期。 提问器模型用于接收用户自然语言,提取用户配置的输出参数,效果优先时还用于提取结果反思和纠正 核采样 模型在输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到核采样值,核采样值可以限制模型选择这些高概率的词汇,从而控制输出内容的多样性。建议不要与温度同时调整。 温度 用于控制生成结果的随机性。调高温度,会使得模型的输出更具多样性和创新性;降低温度,会使输出内容更加遵循指令要求,但同时也会减少模型输出的多样性。 参数配置 输入参数 设置需要添加到问题中的参数,参数值可以引用前置节点的输出参数,或设置为固定文本内容,可引用多个参数。 参数名称:只允许输入字母、数字、下划线,且不能以数字开头。 示例:输入参数为“pre_assigned_meeting_rooms”,希望用户在指定的多个选项中选出一个,后续问题配置为“有以下几个会议室供您选择:{{pre_assigned_meeting_rooms}},请选择您想预订的会议室”。 类型、值:支持“引用”和“输入”两种类型。 引用:用户可以选择工作流中该节点的前置节点的输出变量作为取值。 输入:用户直接输入变量取值文本。 输出参数 该参数用于解析大模型节点的输出,并提供给后序节点的输出参数引用,支持多参数提取。 默认输出参数。 USER_RESPONSE: 用户原始输出。 STATUS:提取状态。 0 正常成功提取,用户无确认。 10 正常成功提取,用户已确认。 100 取到部分参数,用户主动中断,已提参数报错,未提参数按格式置空。 101 取到部分参数,循环超轮次,已提参数报错,未提参数按格式置空。 201 大模型调用异常。 202 反思模块有错误。 参数提取:开启后,可增加需要提取的参数,参数可配置属性如下: 参数名称:只允许输入字母、数字、下划线、短横线。 中文名称:不允许为空。 类型:输出参数的类型,可选String、Integer、Number、Boolean。 默认值:输出参数的默认值,大模型提取不到参数,并达到最大回复轮数时使用默认值。 描述:对于该输出参数的描述。 校验:开启后可自定义参数校验规则对输出参数规范性进行校验。规则包括参数名称、校验类型及校验规则。 提取:开启后该参数必须提取到或配置了默认值则使用默认值,关闭则该参数允许为空。 引用插件:参数提取可能是给插件使用,通过引用插件,可导入插件的参数信息及校验信息,提升配置效率。 问题配置 问题 该参数将在对话框中原样呈现给用户。如未配置此处,将由大模型根据输出参数描述,自动生成包含所有问题关键词的一个问题。 如:请问你的名字是什么。 可通过jinjia语法在问题中使用输入参数 如:请问你是哪个班级的,可选班级有{{classes}} ( classes先在input参数配置好) 最大回复轮数 该参数用于设置与模型的最大交互次数,超过最大回复轮数还没有提取到参数则跳出提问器。 高级配置 允许用户退出交互 开启后,若用户在与提问器的对话交互中,表达“中止对话”类的意图,系统会自动结束当前提问,并跳转至结束节点。 提取参数完毕需要用户确认 开启后,若用户希望提问器参数提取完毕后进行用户确认,则开启此功能。 提取约束 提供大模型额外的约束信息,用于更准确的提取参数,例如指定被提取参数的格式要求。 举例:用户希望提取电话号码tel_number,约束里面可以写tel_number必须是11位数字 追问模式 追问模式用来配置,在多次交互过程中,系统返回的参数追问语句生成模式。 默认:使用默认内置追问模板生成追问语句,每次追问内容相同。 智能追问:使用大模型生成语义良好,表达丰富的追问语句,每次追问内容丰富多变。 自定义追问:按照自定义模板配置生成追问语句。‘{unextracted_cn_field_names}’不可修改或删除。每次追问内容相同。 例如要提取名字和年龄参数 默认:请您提供名字,年龄相关的信息。 智能追问:您好,我们需要获取您的名字和年龄 (模型生成,内容不固定) 自定义追问:(自定义追问模板配置为:请问你的如下信息:{unextracted_cn_field_names}) 请问你的如下信息:名字,年龄 外部API改写 开启后,在调用大模型问答前将调用外部API完成对用户输入问题进行改写,改写API需满足如下要求: 1、POST请求且无需鉴权认证相关信息。 2、输入body体只包含text字段,例如: {"text": "需要改写的内容"}。 3、返回的结构体只包含text字段,例如:{"text": "改写后的内容"}。 图1 提问器节点配置示例 节点配置完成后,单击“确定”。 连接提问器节点和其他节点。 父主题: 工作流节点配置参考
  • 复制ID 对于Agent应用除了具有页面操作的能力之外,还具有Chat API调用能力,对于AppID获取就十分必要。该ID为调用Agent应用接口的agent_id字段。 复制ID的操作步骤如下: 登录Agent开发平台。 在左侧菜单栏,单击“工作台”。 图4 工作台 在工作台开发空间,选择待需要的应用,单击应用的右上部分展开功能列表,选择复制ID 图5 复制ID 弹出复制成功对话框,可以复制到任何地方
  • 使用数据工程构建 图像搜索 模型数据集 图像搜索模型支持接入图片类数据集,目前使用异常检测图片数据集接口导入,数据格式为图片+txt格式,标注内容需要严格安装如下形式标注。 一个标注txt文件中每一行为一个标注信息,每行的标注信息格式如下: 格式一:图片名称;左上角x坐标;左上角y坐标;右下角x坐标;右下角y坐标;一级标签内容-二级标签内容-三级标签内容@ 示例一:示例.jpg;2173;157;2726;617;男衬衣-领型-八字领@ 格式二:图片名称;左上角x坐标;左上角y坐标;右下角x坐标;右下角y坐标;一级标签内容-季节信息-场景信息-风格信息-颜色信息-花型信息-@ 示例二:示例.jpg;1476;203;3163;3037;男西服-SS-英式商务-英式商务-藏蓝-素色-@ 训练数据建议大于5000,训练数据集需要划分为训练集和测试集。 父主题: 开发图像搜索模型
  • 创建插件 创建插件的步骤如下: 登录Agent开发平台。 单击左侧导航栏“工作台”,在“插件”页签,单击右上角“创建插件”。 在“创建插件”页面,填写插件名称与插件描述,设置是否“仅我可见”(设置后仅插件创建者可见)。单击图片可上传插件图标,单击“下一步”。 在“配置信息”页面,参照表1完成信息配置。 表1 插件信息配置说明 参数名称 参数说明 插件URL 插件服务的请求URL地址。 URL协议只支持HTTP和HTTPS。 系统会校验URL地址是否为标准的URL格式。 URL对应的IP默认不应为内网,否则会导致注册失败。 请求方法 插件服务的请求方式,POST或GET。 权限校验 选择调用API时是否需要通过鉴权才可以调用。 无需鉴权:API可以公开访问,不需要任何形式的身份验证或授权。 API Key:在调用API时提供一个唯一的API Key进行鉴权。 需填写密钥位置,即密钥是从Header中读取还是Query中读取。并设置API Key的密钥鉴权参数名和密钥值。 请求头 填写API的请求头信息,例如: Key:Content-Type Value:application/json 图1 API请求信息配置示例 自定义插件使用HTTP服务,或不增加鉴权方式可能存在安全风险。 单击“下一步”,在“参数信息”页面,参照表2完成参数配置。 表2 插件参数配置说明 参数类型 参数名称 参数说明 请求参数 参数封装 开启后,会将请求参数封装为一个列表(数组)结构,可适配入参为数组格式的插件接口。 示例:原参数列表:{"a":"string", "b":1},开启封装后的参数列表:[{"a":"string", "b":1}] 参数名称 参数的名称,参数名称会作为大模型解析参数含义的依据。 中文名称 该参数的中文名称。 参数类型 该参数值的数据类型,String、Integer、Number等多种类型支持选择。 位置 当前参数在请求信息中的位置,可选Body、Headers或Query。 默认值 参数的默认值。 描述 参数的描述,尽可能准确的描述参数的含义和要求,可提升Agent提取参数的准确率。 参数校验 可设置当前参数的校验规则。 必填 指定该参数是否为必填项。 响应参数 参数封装 开启后,会将请求参数封装为一个列表(数组)结构,可适配入参为数组格式的插件接口。 示例:原参数列表:{"a":"string", "b":1},开启封装后的参数列表:[{"a":"string", "b":1}] 参数名称 响应参数的名称,参数名称会作为大模型解析大模型输出结果的依据。 参数描述 响应参数的名称,参数描述会作为大模型解析大模型输出结果的依据。 参数类型 该参数值的数据类型,String、Integer、Number等多种类型支持选择。 是否提取 开启后则该参数必须提取到,关闭则该参数允许为空或者使用默认值。 图2 填写API请求、响应参数
  • 插件节点 插件节点是工作流中实现第三方能力调用的核心组件。作为功能扩展的重要载体,该节点允许通过调用插件来执行特定功能任务。每个插件实质上是经过标准化封装的API工具集合,提供即插即用的模块化服务,拓宽工作流的能力边界,完成更复杂的任务。 插件类型包括预置插件和个人插件。 预置插件:平台预置了代码解释器插件,能够执行输入的代码,得到运行结果。支持开发者直接将插件添加到工作流或应用中,丰富其能力。 自定义插件:平台允许开发者创建自定义插件,支持将API通过配置方式快速创建为插件,提供给工作流或应用调用。 插件节点为可选节点,若无需配置,可跳过该步骤。 插件节点配置步骤如下: 拖动左侧“插件”节点至画布中,在“个人插件”或“预置插件”页签单击“”,将插件添加至画布中。 预置插件为平台内置的插件 个人插件为用户自定义的插件,创建插件步骤详见创建插件。 连接插件节点和其他节点。 单击画布中已添加的“插件”节点,参照表1,完成插件节点的配置。 表1 插件节点配置说明 配置类型 参数名称 参数说明 参数配置 输入参数 参数名称:从插件元信息中导入,用户无需手动添加。 类型、值:支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点的输出变量值,适用于需要从前置节点输出中获取插件入参的场景。 输入:支持用户自定义取值,适用于插件入参取值固定的场景。 输出参数 输出参数所有信息从插件元信息中自动导入,用户无需手动修改。 异常配置 - “异常配置”开关,作为插件节点的兜底配置,当插件执行异常时,支持配置兜底返回,避免整个工作流运行失败: 关闭时,该功能不起作用。 开启时,填写“默认输出”,默认输出的参数需要与插件“输出参数”一致。当工作流插件节点运行正常时,该配置对后续节点没有影响。当工作流运行到插件节点出现异常时,工作流不会中止,继续运行后续节点。如果后续节点引用了插件节点的输出内容,则使用“默认输出”的内容。 图1 插件节点配置示例 节点配置完成后,单击“确定”。 父主题: 工作流节点配置参考
  • 科学计算大模型训练常见报错与解决方案 科学计算大模型训练常见报错及解决方案请详见表1。 表1 科学计算大模型训练常见报错与解决方案 常见报错 问题现象 原因分析 解决方案 训练日志提示“TrainErrorCodes.NotEnoughTrainData”或“TrainErrorCodes.NotEnoughValidData”报错 日志提示“TrainErrorCodes.NotEnoughTrainData”,表示训练集没有有效样本,“TrainErrorCodes.NotEnoughValidData”,表示验证集没有有效样本。 该日志表示数据集中的有效样本量为0,可能有如下原因: 数据文件特征与模型输入要求不符。 数据的时间跨度未满足模型训练要求。 请检查数据是否符合模型要求。 父主题: 训练科学计算大模型
  • 调试Agent应用 创建应用后,平台支持对应用执行过程的进行预览与调试。 调试应用的步骤如下: 在页面右上角单击“”,参考表1配置大模型参数。 表1 大模型参数配置 参数 说明 模型选择 选择要使用的大模型,不同的模型效果存在差异。 模式选择 用于配置大模型的输出多样性。 包含取值: 精确的:模型的输出内容严格遵循指令要求,可能会反复讨论某个主题,或频繁出现相同词汇。 平衡的:平衡模型输出的随机性和准确性。 创意性的:模型输出内容更具多样性和创新性,某些场景下可能会偏离主旨。 自定义:自定义大模型输出的温度和核采样值,生成符合预期的输出。 温度 调高温度会使得模型的输出更多样性和创新性,反之,降低温度会使输出内容更加遵循指令要求但减少多样性,取值范围为0到1之间。 调高温度,会使得模型的输出更多样性和创新性。 降低温度,会使输出内容更加遵循指令要求但减少多样性。 在基于事实的问答场景,可以使用较低的回复随机性数值,以获得更真实和简洁的答案;在创造性的任务例如小说创作,可以适当调高回复随机性数值。建议不要与核采样同时调整。 核采样 模型在输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到核采样值。核采样值可以限制模型选择这些高概率的词汇,从而控制输出内容的多样性,取值范围为0.1到1之间。 在右侧“预览调试”的文本框中输入对话,应用将根据对话生成相应的回答。 在调试过程中,单击右上角“调试”,可以查看当前会话或历史会话的运行结果与调用详情。 图1 查看调试结果
  • 查看训练指标 对于训练状态为“已完成”的任务,单击任务名称,可在“训练结果”页面查看训练指标,模型的训练指标介绍请参见表2。 图1 查看训练指标 表2 训练指标说明 模型 训练指标 指标说明 NLP大模型 训练损失值 训练损失值是一种衡量模型预测结果和真实结果之间的差距的指标,通常情况下越小越好。 一般来说,一个正常的Loss曲线应该是单调递减的,即随着训练的进行,Loss值不断减小,直到收敛到一个较小的值。 NLP大模型 训练精度 强化学习(DPO)训练过程中的指标,表示优选回答(chosen response)与拒绝(rejected response)回答的奖励差值,衡量模型优选回答优于被拒回答的概率。 计算方式:一个训练步的数据中优选回答的奖励分数大于拒绝回答的奖励分数的比例。 NLP大模型 训练优选回复的奖励 强化学习(DPO)训练过程中的指标,表示模型对人类标注的优选回答(chosen response)的偏好得分。 计算方式:在一个训练步的数据中,通过模型对两个候选回复的得分差(优选回复得分减去拒绝回复得分)并经Sigmoid函数映射到[0, 1]范围来确定其奖励分数,得分越高表示越符合人类偏好。 NLP大模型 训练拒绝回复的奖励 强化学习(DPO)训练过程中的指标,表示模型对被人类拒绝的回答(rejected response)的偏好得分。 计算方式:在一个训练步的数据中,通过模型对两个候选回复的得分差(拒绝回复得分减去优选回复得分)并经Sigmoid函数映射到[0, 1]范围来确定其奖励分数,得分越低表示越不符合人类偏好。 NLP大模型 验证损失值 强化学习(DPO)训练中运行验证集的指标,表示模型在验证集上的损失值。值越小,意味着模型对验证集数据的泛化能力越好。 NLP大模型 验证精度 强化学习(DPO)训练中运行验证集的指标,表示优选回答(chosen response)与拒绝(rejected response)回答的奖励差值,衡量模型优选回答优于被拒回答的概率。 计算方式:在验证集中优选回答的奖励分数大于拒绝回答的奖励分数的比例。 NLP大模型 验证优选回复的奖励 强化学习(DPO)训练中运行验证集的指标,表示模型对人类标注的优选回答(chosen response)的偏好得分。 计算方式:在验证集中,通过模型对两个候选回复的得分差(优选回复得分减去拒绝回复得分)并经Sigmoid函数映射到[0, 1]范围来确定其奖励分数,得分越高表示越符合人类偏好。 NLP大模型 验证拒绝回复的奖励 强化学习(DPO)训练中运行验证集的指标,表示模型对被人类拒绝的回答(rejected response)的偏好得分。 计算方式:在验证集中,通过模型对两个候选回复的得分差(拒绝回复得分减去优选回复得分)并经Sigmoid函数映射到[0, 1]范围来确定其奖励分数,得分越低表示越不符合人类偏好。
  • 获取训练日志 单击训练任务名称,可以在“日志”页面查看训练过程中产生的日志。 对于训练异常或失败的任务可以通过训练日志定位训练失败的原因。典型训练报错和解决方案请参见NLP大模型训练常见报错与解决方案。 训练日志可以按照不同的节点(训练阶段)进行筛选查看。分布式训练时,任务被分配到多个工作节点上进行并行处理,每个工作节点负责处理一部分数据或执行特定的计算任务。日志也可以按照不同的工作节点(如worker-0表示第一个工作节点)进行筛选查看。 图2 获取训练日志
  • 查看模型训练状态 在模型训练列表中查看训练任务的状态,各状态说明详见表1。 表1 训练状态说明 训练状态 训练状态含义 初始化 模型训练任务正在进行初始化配置,准备开始训练。 排队中 模型训练任务正在排队,请稍等。 运行中 模型正在训练中,训练过程尚未结束。 停止中 模型训练正在停止中。 已停止 模型训练已被用户手动停止。 失败 模型训练过程中出现错误,需查看日志定位训练失败原因。 已完成 模型训练已完成。
  • NLP大模型默认prompt NLP大模型针对不同的模型、不同模型的版本预置了默认的prompt,具体见表1。 表1 模型预制默认prompt 模型名称 prompt 样例 Pangu-NLP-N1-32K-3.1.34 [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户: 输入示例1-单轮对话: {"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例2-单轮对话 + system prompt: {"system": ["你是一个翻译高手。"],"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [[unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个翻译高手。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例3-多轮对话: {"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] 输入示例4-多轮对话 + system prompt: {"system": ["你是一个算术高手。"],"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个算术高手。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] Pangu-NLP-N1-32K-3.2.36 [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户: 输入示例1-单轮对话: {"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例2-单轮对话 + system prompt: {"system": ["你是一个翻译高手。"],"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [[unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个翻译高手。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例3-多轮对话: {"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] 输入示例4-多轮对话 + system prompt: {"system": ["你是一个算术高手。"],"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个算术高手。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] Pangu-NLP-N2-4K-3.2.35 [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户: 输入示例1-单轮对话: {"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例2-单轮对话 + system prompt: {"system": ["你是一个翻译高手。"],"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [[unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个翻译高手。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例3-多轮对话: {"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] 输入示例4-多轮对话 + system prompt: {"system": ["你是一个算术高手。"],"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个算术高手。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] Pangu-NLP-N2-32K-3.1.35 [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户: 输入示例1-单轮对话: {"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例2-单轮对话 + system prompt: {"system": ["你是一个翻译高手。"],"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [[unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个翻译高手。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例3-多轮对话: {"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] 输入示例4-多轮对话 + system prompt: {"system": ["你是一个算术高手。"],"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个算术高手。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] Pangu-NLP-N4-4K-2.5.35 [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户: 输入示例1-单轮对话: {"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例2-单轮对话 + system prompt: {"system": ["你是一个翻译高手。"],"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个翻译高手。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例3-多轮对话: {"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] 输入示例4-多轮对话 + system prompt: {"system": ["你是一个算术高手。"],"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个算术高手。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] Pangu-NLP-N4-32K-2.5.35 [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户: 输入示例1-单轮对话: {"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例2-单轮对话 + system prompt: {"system": ["你是一个翻译高手。"],"context": ["给定一个英文句子,翻译成中文。\nI love to learn new things every day."], "target": "我每天喜欢学习新事物。"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个翻译高手。[unused10][unused9]用户:给定一个英文句子,翻译成中文。\nI love to learn new things every day. [unused10][unused9]助手:我每天喜欢学习新事物。[unused10] 输入示例3-多轮对话: {"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户的问题给出高质量解答。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] 输入示例4-多轮对话 + system prompt: {"system": ["你是一个算术高手。"],"context": ["给出一个数学运算,计算它的结果。\n2453 + 4567。", "两数相加的结果为:6920。", "1 + 1。"], "target": "2"} 数据处理后: [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个算术高手。[unused10][unused9]用户:给出一个数学运算,计算它的结果。\n2453 + 4567。[unused10][unused9]助手:两数相加的结果为:6920。[unused10][unused9]用户:1 + 1。[unused10][unused9]助手:2[unused10] 父主题: 训练NLP大模型
  • 使用MCP服务 在Agent开发平台中,开发者可以在开发智能体应用、工作流应用时,添加预置和自定义创建的MCP服务。 在智能体应用开发时配置MCP服务: 步骤一:进入Agent开发平台后,在导航栏选择“工作台”。 步骤二:在右侧导航栏中选择“应用”,单击创建“创建应用”,进入创建应用开发页面。 步骤三:在应用开发页面,技能配置,MCP服务模块,单击添加,进入MCP服务选择页面。 步骤四:从官方服务、个人服务中选中所需要的MCP服务。 步骤五:单击确定,完成MCP服务添加。 步骤六:在右侧调试模块,对话框输入问题,如大模型MCP服务,对话界面展示可展示调用详情。 在工作流应用中开发时配置MCP服务: 步骤一:进入Agent开发平台后,在导航栏选择“工作台”。 步骤二:在右侧导航栏中选择“工作流”,单击“创建工作流”,进入工作流开发页面。 步骤三:在工作流开发页面,在左侧导航栏选中MCP节点,拖拽至工作流编排画布。 步骤四:在MCP选择弹窗中,从官方服务、个人服务中选中所需要的MCP服务。 步骤五:单击确定,完成MCP服务添加。
  • 创建自定义MCP服务 如果您已有可用的工具和API资源,则可以使用MCP服务器来配置您的MCP扩展。完成MCP服务器构建后,只需要在Agent开发平台配置对应的工具即可创建自己的MCP服务。 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。 图3 我的空间 在左侧导航栏中选择“Agent开发”,跳转至Agent开发平台。 在右侧导航栏中选择“MCP服务”,单击“创建MCP服务”,进入创建MCP页面。 在“创建MCP服务”页面,参考表1配置“MCP服务名称”、“英文名称”、“MCP服务地址”、“描述”以及“权限校验”选项后,单击“测试并下一步”。 表1 MCP服务信息配置说明 参数名称 参数说明 MCP服务名称 MCP服务中文名。 英文名称 MCP服务英文名,需确保同一个租户下唯一。 MCP服务地址 MCP服务SSE地址。 服务URL地址只支持HTTP和HTTPS。 系统会校验URL地址是否为标准的URL格式。 URL对应的IP默认不应为内网,否则会导致注册失败。 说明: 支持网站公开的MCP服务,也支持用户自行创建的MCP服务。 描述 MCP服务描述。 仅我可见 是否仅创建者可见。 权限校验 选择调用MCP服务时是否需要通过认证才可以调用。 无需鉴权:MCP服务可以公开访问,不需要任何形式的身份验证或授权。 API Key:在调用MCP服务时提供唯一的API Key进行鉴权。 需填写密钥位置,即密钥信息是设置在Header中还是设置在Query中。并设置API Key的密钥鉴权参数名和密钥值。 说明: 若服务地址中包含有认证信息,建议使用平台的权限校验(API Key)功能。 图4 创建MCP服务 图5 权限校验示例 图6 连通性测试成功示例 测试完成,单击确认完成MCP服务创建。
  • 试运行工作流 Agent开发平台支持对整个工作流进行试运行,也支持对工作流的单个节点进行调试。 试运行工作流: 工作流编排完成后,单击右上角“试运行”,在对话框中输入问题,等待返回试运行结果。 在试运行过程中,可以单击右上角“”查看调试结果,包括运行结果与调用详情。 图1 调试结果示例 单节点调试,以调试“意图识别”节点为例: 在工作流编排页面,单击意图识别节点的“”,进入单节点调试页面。 编写输入参数内容,单击“开始运行”。 图2 编写输入参数内容 可在“运行结果”页面查看当前节点的运行结果。 若运行成功,节点处也将显示“运行成功”字样。 图3 单节点调试运行成功示例
  • 准备工作 本章节的边缘部署操作以largemodel集群为例,示例集群信息如下表。 表2 示例集群信息 集群名 节点类型 节点名 规格 备注 largemodel controller ecs-edge-XXXX 鲲鹏通用计算型|8vCPUs|29GiB|rc3.2xlarge.4镜像 EulerOS 2.9 64bit with ARM for Tenant 20230728 base 2.9.15 公网IP:100.85.220.207 root密码:/ CPU架构:aarch64(登录设备,执行arch命令查看) worker bms-panguXXXX CPU:Kunpeng 内存:24*64GB DDR4 RAM (GB) 本地磁盘:3*7.68TB NVMe SSD 扩展配置:2*100GE+8*200GE 类型:physical.kat2e.48xlarge.8.313t.ei.pod101 euler2.10_arm_sdi3_1980b_hc_sdi5_b080_20230831v2 公网IP:100.85.216.151 root密码:/ CPU架构:aarch64(登录设备,执行arch命令查看) 依赖包下载。 docker下载:https://download.docker.com/linux/static/stable 选择对应cpu架构下载,docker版本选在19.0.3+。 K3S下载:https://github.com/k3s-io/k3s/releases/tag/v1.21.12%2Bk3s1 按照对应cpu架构下载二进制文件以及air-gap镜像。 npu驱动和固件安装。 执行命令npu-smi info查看驱动是否已安装。如果有回显npu卡信息,说明驱动已安装。 详情请参见昇腾官方文档。 hccn too网卡配置。 执行如下命令,查看是否有回显网卡信息。如果有,则说明网卡已经配置,否则继续操作下面步骤。 cat /etc/hccn.conf 执行如下命令,查看npu卡数。 npu-smi info 执行如下命令(地址自行配置): hccn_tool -i 0 -ip -s address 192.168.0.230 netmask 255.255.255.0 hccn_tool -i 1 -ip -s address 192.168.0.231 netmask 255.255.255.0 hccn_tool -i 2 -ip -s address 192.168.0.232 netmask 255.255.255.0 hccn_tool -i 3 -ip -s address 192.168.0.233 netmask 255.255.255.0 hccn_tool -i 4 -ip -s address 192.168.0.234 netmask 255.255.255.0 hccn_tool -i 5 -ip -s address 192.168.0.235 netmask 255.255.255.0 hccn_tool -i 6 -ip -s address 192.168.0.236 netmask 255.255.255.0 hccn_tool -i 7 -ip -s address 192.168.0.237 netmask 255.255.255.0 执行命令cat /etc/hccn.conf,确保有如下回显网卡信息,则配置完成。 配置NFS网盘服务。 大模型采用镜像+模型分开的方式部署时,需要有一个节点来提供nfs网盘服务,创建部署时通过nfs挂载的方式访问模型。
  • EXCEL模板格式 表2 EXCEL模板样例 答案 问题 相似问题1(非必填) 相似问题2(非必填) 相似问题3(非必须) 相似问题4(非必须) 目录(非必须) 标签(非必须,逗号分隔) 云搜索服务 (Cloud Search Service,简称 CSS )是一个基于Elasticsearch且完全托管的在线分布式搜索服务,为用户提供结构化、非结构化文本、以及基于AI向量的多条件检索、统计、报表。 什么是 云搜索 服务 什么是华为云搜索服务 云搜索服务是什么 华为云搜索服务是什么 什么是 CS S 云搜索服务可以帮助网站和APP搭建搜索框,提升用户的搜索体验;也可以用于搭建 日志分析 平台,助力企业实现数据驱动运维,数据驱动运营;它的向量检索能力可以帮助客户快速构建基于AI的图搜、推荐、语义搜索等丰富的应用。 云搜索服务有什么应用场景 云搜索服务有哪些应用场景 云搜索服务有什么作用 云搜索服务的作用有哪些 CSS的作用有哪些 公有云提供了Web化的服务管理平台,即管理控制台和基于HTTPS请求的API(Application programming interface)管理方式。 云搜索服务有哪些访问方式 云搜索服务提供了什么访问方式 如何访问云搜索服务 如何访问CSS
  • 向量&重排模型介绍 Pangu-EmbeddingRank模型,用于大模型RAG场景。在ModelArts Studio大模型开发平台部署Pangu-EmbeddingRank模型,会生成Embedding模型服务、Rerank模型服务两个服务。这两个服务均可以在Agent开发平台中创建知识库中被使用。其中Embedding模型服务在创建知识库中,文本处理阶段,用于对文本文档进行前片,转换成向量化表示。在知识检索阶段,根据用户输入的query对切片进行召回,Rerank模型服务用于对召回的切片,按照query与切片的相关度进行精细化排序,以确保召回相关度top切片。 表1 推理特性 推理精度 FP16 起推规格(推理单元) 1 QPS 6 父主题: 开发盘古向量&重排模型
  • MCP服务节点配置说明 MCP服务节点是工作流中实现第三方能力调用的核心组件之一。作为功能扩展的重要载体,该节点允许通过调用MCP服务来执行特定功能任务。每个MCP服务实质上是一个工具集合,可以提供模块化服务来拓宽工作流的能力边界,完成更复杂的任务。 MCP服务类型包括预置服务和个人服务。 预置服务:平台预置了"高德地图"、"车票查询工具"、"必应搜索"等多种实用MCP服务,开通后可以一键集成调用。支持开发者在工作流或应用中添加预置MCP服务,丰富其能力。 个人服务:平台允许开发者创建自定义MCP服务,支持将MCP服务地址通过配置方式快速创建为自定义MCP服务,提供给工作流或应用调用。 MCP服务节点为可选节点,若无需配置,可跳过该步骤。 MCP服务节点配置步骤如下: 拖动左侧“MCP服务”节点至画布中,在“个人服务”或“预置服务”页签单击“”,将MCP服务添加至画布中,其中有些“预置服务”不能直接添加,需要单击“立即开通”,开通服务后即可添加至画布中。 预置服务为平台内置的MCP服务。 个人服务为用户创建的自定义MCP服务,创建MCP服务步骤详见创建MCP服务。 连接MCP服务节点和其他节点。 单击画布中已添加的“MCP服务”节点,参照表1 MCP服务节点配置说明,完成MCP服务节点的配置。 表1 MCP服务节点配置说明 配置类型 参数名称 参数说明 参数配置 工具 支持从当前MCP服务所包含的工具列表中选择一个作为工作流运行到该节点时会执行的工具。 输入参数 参数名称、类型:从插件元信息中导入,用户无需手动添加。 值:支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点的输出变量值和全局配置中的记忆变量,适用于需要从前置节点输出中获取插件入参的场景。 输入:支持用户自定义取值,适用于MCP服务入参取值固定的场景。 输出参数 输出参数所有信息从MCP服务元信息中自动导入,用户无需手动配置。 图1 MCP服务节点配置示例 节点配置完成后,单击“确定”。 父主题: 工作流节点配置参考
  • 音频类数据集格式要求 ModelArts Studio大模型开发平台支持创建音频类数据集,创建时可导入多种形式的数据,具体格式要求详见表1 表1 音频类数据集格式要求 文件内容 文件格式 文件要求 仅音频 音频 格式支持:mp3、flac、wav、opus、aac、m4a。所有音频可以放在多个文件夹下,每个文件夹下可以同时包含多种格式的音频。 从OBS导入:单个文件大小不超过50GB,文件数量不限制。 音频+标注 音频+jsonl 音频格式支持:mp3、flac、wav、opus、aac、m4a。 标注文件格式:jsonl。 从OBS导入:单个文件大小不超过50GB,文件数量不限制。 示例如下所示: 具体的jsonl标注文件参考: {"audio_name":"dir/16k_16bit_1channel_2s.flac","caption":"1"} {"audio_name":"dir/16k_16bit_1channel_2s.mp3","caption":"2"} {"audio_name":"dir/16k_16bit_1channel_2s.opus","caption":"3"} {"audio_name":"dir/16k_16bit_1channel_2s.wav","caption":"4"} 父主题: 数据集格式要求
  • 判断节点 判断节点是一个IF-ELSE节点,提供了多分支条件判断的能力,用于设计分支流程,实现逻辑判断功能。 判断节点中每个条件分支支持添加多个判断条件(且、或),同时支持添加多个条件分支。 当向该节点输入参数时,节点会逐个条件分支判断输入是否符合分支中预设的条件,符合则执行对应分支后的工作流流程,如果没有符合条件的分支,则执行“ELSE”对应的工作流分支。 判断节点为可选节点,若无需配置,可跳过该步骤。 判断节点配置步骤如下: 拖动左侧“判断”节点至画布中,单击该节点以打开节点配置页面。 参照表1,完成判断节点的配置。 表1 判断节点配置说明 配置类型 参数名称 参数说明 参数配置 IF IF分支由[判断参数 比较条件 比较参数]组成一个条件表达式。 判断参数:条件表达式左边部分,需要选择来自前序节点的输出参数。 比较条件:条件表达式中间部分,当前支持的比较条件有:长度大于、长度大于等于、长度小于、长度小于等于、等于、不等于、包含、不包含、为空、不为空。针对不同的判断参数类型,前端将展示不同的比较条件。 比较参数:条件表达式右边部分,支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点输出变量值。 输入:支持用户自定义取值。 添加条件:单击“+”,在当前条件分支中添加多个条件表达式,多个条件表达式之间通过“且”或“或”来连接。 单击“且”或“或”,可以切换该分支表达式的运算逻辑。 ELSE 用于控制预设条件分支都不满足的场景,如果逐个分支判断都不符合条件,则默认走该分支执行后续工作流流程。 添加分支 可以添加新的条件分支ELSE IF,新分支的配置方式与IF分支相同。 图1 判断节点配置示例 节点配置完成后,单击“确定”。 连接判断节点和其他节点。 示例: 以常见的String、Integer和Boolean类型条件判断为例,在开始节点中定义三种类型的参数,模拟判断节点的输入参数,实现对于不同类型参数在不同条件下的逻辑判断。 节点配置如下: 开始节点:定义三种类型参数,分别为String类型的string_key、Integer类型的int_key、Boolean类型的bool_key 判断节点:在IF条件分支中增加三个判断条件,条件表达式的判断参数分别引用开始节点上述的三种类型参数。对于不同类型的参数,前端展示的比较条件有所区别。 比如String类型为字符串相关的长度、包含和为空条件判断,示例中配置为判断string_key是否包含“abc”。 Integer类型为数值相关的大小等于条件判断,示例中配置为判断int_key是否大于6。 Boolean类型为true false条件判断,示例中配置为判断bool_key是否为true。 单击试运行,输入string_key:abcd、int_key:7、bool_key:true查看效果 父主题: 工作流节点配置参考
  • 步骤4:设置开场白、推荐问题、追问 添加开场白。 您可以为智能体添加一个开场白,该开场白将气泡内作为应用开场白展示给用户。你也可以使用开场白菜单右侧的“智能添加”按钮自动用生成开场白。 图7 添加开场白 添加推荐问题。 您可以为智能体添加一些预置的推荐问题。可以为该医疗问诊助手添加一些推荐问题,例如“我想增加肌肉量,怎么办?”“最近有点咳嗽”,“我肚子疼”等。 你也可以单击推荐问题菜单右侧的“智能添加”按钮自动产生一些推荐问题。 图8 添加推荐问题 设置追问。 在每轮回复后,默认根据对话内容提供提问建议,您可以使用开关按钮启动或关闭追问功能。同时您也可以自定义追问生成规则。例如: 图9 设置追问
  • 步骤1:创建Agent应用 登录Agent开发平台。 在页面左上角单击“创建应用”菜单。 输入智能体名称和功能介绍,为智能体选择一个图标作为头像。 单击“确认”。 创建智能体后,你会直接进入智能体编排页面。您可以: 在左侧提示词面板中描述智能体的身份和任务。 在中间技能面板为智能体配置各种扩展能力。 在中间对话体验面板为智能体配置各种对话配置。 在右侧预览与调试面板中,实时调试智能体。 图2 创建应用
  • 步骤2:编写提示词 配置智能体的第一步就是编写提示词,也就是智能体的人设与回复逻辑。智能体的提示词定义了智能体的基本人设,此人设会持续影响智能体在所有会话中的回复效果。建议在人设与回复逻辑中指定模型的角色、任务描述、约束条件、执行步骤和输出格式等。 在智能体配置页面的提示词面板中输入提示词。例如医疗问助手的提示词可以设置为: 你是一名私人数字健康管理师。你能够和医生一样进行问诊,询问患者的病情,并给出建议和治疗方案。 \n\n\n 要求:\n 1. 专注于疾病、症状、检查、药物等相关询问,\n 2. 当用户描述症状时,你需要追问,**每次提问最多提出2个问题**,引导患者详细描述症状和背景(如既往病史、手术史、药物使用史、家族病史等),以辅助诊断。\n 3. 当患者信息足够或你已全面理解患者的主要问题及症状发展后,直接总结病情,建议必要的检查、治疗方案和就诊科室。\n 4. 确保回答准确、简洁,直接相关患者当前健康状况或问题,避免偏题。\n 5. **不重复历史对话中的问题**。如患者未回答某问题,不再追问。\n 6. **不重复患者描述的症状**。确保对话内容新颖且相关。\n 7. 你返回的内容不应该超过100字,注意每句话应该换行。\n 8. **严禁回答医学知识以外的问题,如闲聊、娱乐等**。\n 请严格遵守以上规则,仅提供**必要的、简洁的**回答。 图3 编写提示词 您可以使用平台的智能优化提示词功能对上述的提示词进行优化。 图4 智能优化提示词 优化后的结果如下: ## 人设 - 角色:私人数字健康管理师 - 专业技能:疾病诊断、症状分析、检查建议、药物治疗建议 ## 任务描述 - 目标:通过问诊,了解患者的病情,提供必要的建议和治疗方案。 - 积极影响:帮助用户更好地理解自己的健康状况,提供针对性的医疗建议。 ## 约束条件 - 专注于疾病、症状、检查、药物等相,了解患者的病情,提供必要的建议和治疗方案。 - 每次提问最多提出2个问题。 - 不重复历史对话中的问题。 - 不重复患者描述的症状。 - 回答不超过100字,每句话换行。 - 严禁回答医学知识以外的问题。 ## 执行步骤 1. 询问患者的主要症状。 2. 根据患者描述,追问相关背景信息(既往病史、手术史、药物使用史、家族病史等)。 3. 总结病情,建议必要的检查、治疗方案和就,了解患者的病情,提供必要的建议和治疗方案。 ## 输出格式 - 风格:准确、简洁、直接相关患者当前健康状况或问题。 - 字数:不超过100字。 - 格式:每句话换行。
  • 步骤3:为Agent添加技能(可选) 如果模型能力可以基本覆盖智能体的功能,则只需要为智能体编写提示词即可。但是如果你为智能体设计的功能无法仅通过模型能力完成,则需要为智能体添加技能,拓展它的能力边界。例如模型的训练数据是互联网上的公开数据,模型通常不具备垂直领域的专业知识,如果智能体涉及专业领域知识的智能问答场景,你需要为其添加专属的知识库,解决模型专业领域知识不足的问题。 作为医疗问诊助手机器人,模型能力基本可以实现我们预期的效果。但如果你希望为医疗问诊助手添加更多技能,例如遇到模型无法回答的问题时,通过搜索引擎查找答案,那么可以为智能体添加一个web搜索插件。 在编排页面的技能区域,单击插件功能对应的 + 图标。 在添加插件页面,搜索 WebSearch,然后单击创建插件。 图5 添加插件 修改提示词中的人设与回复逻辑,指示智能体使用 WebSearch 插件来回答自己不确定的问题。否则,智能体可能不会按照预期调用该工具。 图6 修改提示词
  • 查看模型训练状态 在模型训练列表中查看训练任务的状态,各状态说明详见表1。 表1 训练状态说明 训练状态 训练状态含义 初始化 模型训练任务正在进行初始化配置,准备开始训练。 排队中 模型训练任务正在排队,请稍等。 运行中 模型正在训练中,训练过程尚未结束。 停止中 模型训练正在停止中。 已停止 模型训练已被用户手动停止。 失败 模型训练过程中出现错误,需查看日志定位训练失败原因。 已完成 模型训练已完成。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全