华为云用户手册

  • 配置应用部署步骤并部署应用 以下为Tomcat应用部署模板的初始化步骤及其参数说明,如需了解更多步骤详情可参考部署步骤详解。 配置应用部署步骤。 切换到“部署步骤”页签,单击“编辑”对部署步骤进行参数配置。 安装JDK 表2 安装JDK参数说明 参数项 是否必填 说明 步骤显示名称 是 步骤添加后在部署步骤显示的名称。仅支持汉字、英文字母、数字、空格、或-_,;:./()()符号,其中空格不可在名称开头或结尾使用,长度为1-128。 环境 是 选择当前资源类型为主机集群的环境,作为部署对象。 请选择jdk版本 是 jdk的版本。 jdk安装路径 是 jdk的安装路径。 控制选项 否 配置是否启用该操作。 失败后继续运行:当前步骤部署失败后,应用是否继续部署后续的步骤。 使用sudo权限执行:配置是否使用sudo权限部署该步骤。 安装Tomcat 表3 安装Tomcat参数说明 参数项 是否必填 说明 步骤显示名称 是 步骤添加后在部署步骤显示的名称。 仅支持汉字、英文字母、数字、空格、或-_,;:./()()符号,其中空格不可在名称开头或结尾使用,长度为1-128。 环境 是 选择当前资源类型为主机集群的环境,作为部署对象。 tomcat版本 是 选择要安装的tomcat的版本号。 安装路径 是 tomcat的安装路径。 http端口 是 默认为8080。 ajp端口 是 默认为8009。 shutdown端口 是 默认为8005。 控制选项 否 配置是否启用该操作。 失败后继续运行:当前步骤部署失败后,应用是否继续部署后续的步骤。 使用sudo权限执行:配置是否使用sudo权限部署该步骤。 停止Tomcat服务 表4 停止Tomcat服务参数说明 参数项 是否必填 说明 步骤显示名称 是 步骤添加后在部署步骤显示的名称。 仅支持汉字、英文字母、数字、空格、或-_,;:./()()符号,其中空格不可在名称开头或结尾使用,长度为1-128。 环境 是 选择当前资源类型为主机集群的环境,作为部署对象。 服务操作类型 是 配置“停止服务”。 服务对应的绝对路径 是 Tomcat服务的路径。 控制选项 否 配置是否启用该操作。 失败后继续运行:当前步骤部署失败后,应用是否继续部署后续的步骤。 使用sudo权限执行:配置是否使用sudo权限部署该步骤。 选择部署来源 表5 选择部署来源参数说明 参数项 是否必填 说明 步骤显示名称 是 步骤添加后在部署步骤显示的名称。 仅支持汉字、英文字母、数字、空格、或-_,;:./()()符号,其中空格不可在名称开头或结尾使用,长度为1-128。 选择源类型 是 包括“制品仓库”和“构建任务”两种类型。 环境 是 选择当前资源类型为主机集群的环境,作为部署对象。 选择软件包 是 可以选择制品仓库已有软件包,也可以选择本地上传的软件包/文件(上传到到制品仓库的软件包/文件,可以重复使用)。 package_url是软件包在制品仓库中的路径。 下载到主机的部署目录 是 软件包下载后的路径。 控制选项 否 配置是否启用该操作。 失败后继续运行:当前步骤部署失败后,应用是否继续部署后续的步骤。 使用sudo权限执行:配置是否使用sudo权限部署该步骤。 此处的部署来源以选择“制品仓库”为例,进行相应的参数说明。如部署来源选择“构建任务”,相关信息可参考《用户指南》里选择部署来源章节。 启动Tomcat服务 表6 启动Tomcat服务参数说明 参数项 是否必填 说明 步骤显示名称 是 步骤添加后在部署步骤显示的名称。 仅支持汉字、英文字母、数字、空格、或-_,;:./()()符号,其中空格不可在名称开头或结尾使用,长度为1-128。 环境 是 选择当前资源类型为主机集群的环境,作为部署对象。 服务操作类型 是 配置“启动服务”。 服务对应的绝对路径 是 Tomcat服务的路径。 http端口 是 Tomcat服务监听的http端口。 ajp端口 是 Tomcat服务监听的ajp端口。 shutdown端口 是 Tomcat服务监听的shutdown端口。 等待时间 是 等待已设置的时长后将监测服务是否已成功启动。可根据服务启动实际所需时间进行调整,如时间设置不合理,会导致检测结果无效。 输入限制:0-300,单位“秒”。 组件监控 否 配置是否启用应用运维服务( AOM ),该服务提供指标监控、日志查询、告警功能(勾选后自动安装数据采集器 ICAgent,仅支持华为云linux主机,且与此应用在同一region下),详细请参见配置组件监控。 服务关联组件 是 如勾选“组件监控”,则会配置此项参数。 此处选择或新建当前启动服务需要关联的组件。 日志路径 否 如勾选“组件监控”,则会配置此项参数。 填写服务的日志文件路径。日志文件仅支持以.log、.trace和.out结尾的文件,可以配置文件夹路径,且最多配置10个路径 控制选项 否 配置是否启用该操作。 失败后继续运行:当前步骤部署失败后,应用是否继续部署后续的步骤。 使用sudo权限执行:配置是否使用sudo权限部署该步骤。 URL健康测试 表7 URL健康测试参数说明 参数项 是否必填 说明 步骤显示名称 是 步骤添加后在部署步骤显示的名称。 仅支持汉字、英文字母、数字、空格、或-_,;:./()()符号,其中空格不可在名称开头或结尾使用,长度为1-128。 环境 是 选择当前资源类型为主机集群的环境,作为部署对象。 重试次数 是 失败后重试次数,超过重试次数服务未启动会导致URL检测失败。 间隔时间 是 两次重试的间隔时间。 输入限制:0-60,单位“秒”。 测试路径 是 待测试服务的路径,可以添加多个。 控制选项 否 配置是否启用该操作。 失败后继续运行:当前步骤部署失败后,应用是否继续部署后续的步骤。 “URL健康测试”的参数填写完成后,即完成了所有的参数配置。更多应用配置请参考配置CodeArts Deploy应用的参数。 部署应用。 配置好上述参数后,单击“保存并部署”即可开始部署应用。 应用部署成功。 应用部署失败时,可参考以下流程排查原因。 查看自动匹配解决方案 如果应用部署失败,可单击原子操作下的“查看解决方案”,前往对应的帮助中心页面。 手动搜索解决方案 如果所匹配的帮助中心页面未能解决问题,可将错误信息(即框图内容)粘贴到帮助中心的搜索栏,进行手动搜索解决方案。 更多部署问题,请参考应用部署常见问题排查。 发起技术支持申请 如果仍未能搜索到可行的解决方案,您可新建工单申请华为工程师协助。
  • 准备工作 已有可用项目,如果没有,请先创建项目,参考新建 CodeArts 项目。 具有创建应用的权限,参考配置CodeArts Deploy应用不同角色的管理权限。 已经编译完成的软件包。 在“选择部署来源”步骤时,有“制品仓库”和“构建任务”两个选项。由于本例中选择的是“制品仓库”,所以应该提前准备好已编译完成的软件包。如果选择“构建任务”,则不需要准备软件包。 已拥有E CS 云主机(如果没有,请参考购买弹性云服务器完成购买,过程中可能产生费用,详情可参考ECS计费说明)。
  • 知识库介绍 平台提供了知识库功能来管理和存储数据,支持为应用提供自定义数据,并与之进行互动。 知识库支持导入以下格式的本地文档: 文本文档数据。支持上传常见文本格式,包括:txt、doc、docx、pdf、ppt、pptx格式。 表格数据。支持上传常见的表格文件格式,便于管理和分析结构化数据,包括:xlsx、xls、csv格式。 无论是文本文档、演示文稿,还是电子表格文件,用户都可以轻松地将数据导入知识库,无需额外的转换或格式处理。 父主题: 创建与管理知识库
  • 创建插件 创建插件的步骤如下: 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。 在左侧导航栏中选择“Agent开发”,跳转至Agent开发平台。 单击左侧导航栏“工作台”,在“插件”页签,单击右上角“创建插件”。 在“创建插件”页面,填写插件名称与插件描述,单击图片可上传插件图标,单击“下一步”。 在“配置信息”页面,参照表1完成信息配置。 表1 插件信息配置说明 参数名称 参数说明 插件URL 插件服务的请求URL地址。 URL协议只支持HTTP和HTTPS。 系统会校验URL地址是否为标准的URL格式。 URL对应的IP默认不应为内网,否则会导致注册失败。仅在非商用环境部署时,才允许支持内网URL,且需要通过相关的服务的启动配置项关闭内网屏蔽。 请求方法 插件服务的请求方式,POST或GET。 权限校验 选择调用API时是否需要通过鉴权才可以调用。 无需鉴权:API可以公开访问,不需要任何形式的身份验证或授权。 用户级鉴权:需要用户提供身份验证信息来访问API。 需填写密钥位置,即密钥是从Header中读取还是Query中读取。并设置密钥鉴权参数名、密钥来源参数名,以确保系统能够正确地提取和使用鉴权信息。 API Key:在调用API时提供一个唯一的API Key进行鉴权。 需填写密钥位置,即密钥是从Header中读取还是Query中读取。并设置API Key的密钥鉴权参数名和密钥值。 请求头 填写API的请求头信息,例如: Key:Content-Type Value:application/json 图1 API请求信息配置示例 自定义插件使用HTTP服务,或不增加鉴权方式可能存在安全风险。 单击“下一步”,在“参数信息”页面,参照表2完成参数配置。 表2 插件参数配置说明 参数类型 参数名称 参数说明 请求参数 参数封装 开启后,会将请求参数封装为一个列表(数组)结构,可适配入参为数组格式的插件接口。 示例:原参数列表:{"a":"string", "b":1},开启封装后的参数列表:[{"a":"string", "b":1}] 参数名称 参数的名称,参数名称会作为大模型解析参数含义的依据。 中文名称 该参数的中文名称。 参数类型 该参数值的数据类型,String、Integer、Number等多种类型支持选择。 位置 当前参数在请求信息中的位置,可选Body、Headers或Query。 默认值 参数的默认值。 描述 参数的描述,尽可能准确的描述参数的含义和要求,可提升Agent提取参数的准确率。 参数校验 可设置当前参数的校验规则。 必填 指定该参数是否为必填项。 响应参数 参数封装 开启后,会将请求参数封装为一个列表(数组)结构,可适配入参为数组格式的插件接口。 示例:原参数列表:{"a":"string", "b":1},开启封装后的参数列表:[{"a":"string", "b":1}] 参数名称 响应参数的名称,参数名称会作为大模型解析大模型输出结果的依据。 参数描述 响应参数的名称,参数描述会作为大模型解析大模型输出结果的依据。 参数类型 该参数值的数据类型,String、Integer、Number等多种类型支持选择。 是否提取 开启后则该参数必须提取到,关闭则该参数允许为空或者使用默认值。 图2 填写API请求、响应参数 父主题: 创建与管理插件
  • 插件介绍 在Agent开发平台中,插件是大模型能力的重要扩展。通过模块化方式,插件能够为大模型提供更多专业技能和复杂任务处理能力,使其在多样化的实际场景中更加高效地满足用户需求。 通过插件接入,用户可以为应用赋予大模型本身不具备的能力。插件提供丰富的外部服务接口,当任务执行时,模型会根据提示词感知适用的插件,并自动调用它们,从外部服务中获取结果并返回。这样的设计使得Agent能够智能处理复杂任务,甚至跨领域解决问题,实现对复杂问题的自动化处理。 Agent开发平台支持两种类型的插件: 预置插件:平台为开发者和用户提供了预置插件,直接可用,无需额外开发。例如,平台提供的“Python解释器插件”能够根据用户输入的问题自动生成Python代码,并执行该代码获取结果。此插件为Agent提供了强大的计算、数据处理和分析功能,用户只需将其添加到应用中,即可扩展功能。 自定义插件:为了满足更个性化的需求,平台允许开发者创建自定义插件,支持将API通过配置方式快速创建为插件,并供Agent调用。这样,开发者可以根据特定需求为应用增加专属功能。 父主题: 创建与管理插件
  • 应用介绍 在Agent开发平台上,用户可以构建两种类型的应用: 知识型Agent:以大模型为任务执行核心,适用于文本生成和文本检索任务,如搜索问答助手、代码生成助手等。用户通过配置Prompt、知识库等信息,使得大模型能够自主规划和调用工具。 优点:零代码开发,对话过程智能化。 缺点:大模型在面对复杂的、长链条的流程时可能会受到输入长度限制,难以有效处理较为复杂的工作流。 流程型Agent:以工作流为任务执行核心,用户可以通过在画布上“拖拽”节点来搭建任务流程。支持编排的节点类型包括:大模型节点、知识检索节点、意图识别节点、插件节点、判断节点、代码节点、消息节点、提问器节点。 优点:高度可扩展,支持低代码开发。 缺点:对话交互的智能度较低,复杂场景下流程分支较多,维护难度较大。 父主题: 编排与调用应用
  • 构建科学计算大模型数据集流程 在ModelArts Studio大模型开发平台中,使用数据工程创建盘古科学计算大模型数据集流程见表2。 表2 盘古科学计算大模型数据集构建流程 流程 子流程 说明 操作指导 导入数据至盘古平台 创建导入任务 将存储在OBS服务中的数据导入至平台统一管理,用于后续加工或发布操作。 导入数据至盘古平台 加工气象类数据集 加工气象类数据集 通过专用的加工算子对数据进行预处理,确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子,例如去除噪声、冗余信息等,提升数据质量。 加工气象类数据集 发布气象类数据集 发布气象类数据集 数据发布是将单个数据集发布为特定格式的“发布数据集”,用于后续模型训练等操作。 发布气象类数据集
  • 训练NLP大模型所需数据量 使用数据工程构建盘古NLP大模型数据集进行模型训练时,所需数据量见表2。 表2 构建NLP大模型所需数据量 模型规格 训练类型 推荐数据量 最小数据量(数据条数) 单场景推荐训练数据量 单条数据Token长度限制 N1 微调 - 1000条/每场景 ≥ 1万条/每场景 32K N2 微调 - 1000条/每场景 ≥ 1万条/每场景 32K N4 微调 - 1000条/每场景 ≥ 1万条/每场景 4K版本:4096 32K版本:32768
  • 构建NLP大模型数据集流程 在ModelArts Studio大模型开发平台中,使用数据工程构建盘古NLP大模型数据集流程见表3。 表3 盘古NLP大模型数据集构建流程 流程 子流程 说明 操作指导 导入数据至盘古平台 创建导入任务 将存储在OBS服务中的数据导入至平台统一管理,用于后续加工或发布操作。 导入数据至盘古平台 加工文本类数据集 加工文本类数据集 通过专用的加工算子对数据进行预处理,确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子,例如去除噪声、冗余信息等,提升数据质量。 加工文本类数据集 合成文本类数据集 利用预置或自定义的数据指令对原始数据进行处理,并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集,增强训练模型的多样性和泛化能力。 合成文本类数据集 标注文本类数据集 为无标签数据集添加准确的标签,确保模型训练所需的高质量数据。平台支持人工标注和AI预标注两种方式,用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。 标注文本类数据集 配比文本类数据集 数据配比是将多个数据集按特定比例组合的过程。通过合理的配比,确保数据集的多样性、平衡性和代表性,避免因数据分布不均而引发的问题。 配比文本类数据集 发布文本类数据集 评估文本类数据集 平台预置了多种数据类型的基础评估标准,包括NLP、视频和图片数据,用户可根据需求选择预置标准或自定义评估标准,从而精确优化数据质量,确保数据满足高标准,提升模型性能。 评估文本类数据集 发布文本类数据集 发布流通是将单个数据集发布为特定格式的“发布数据集”,用于后续模型训练等操作。 平台支持发布的数据集格式为默认格式、盘古格式。 默认格式:平台默认的格式。 盘古格式:训练盘古大模型时,需要发布为该格式。当前仅文本类、图片类数据集支持发布为盘古格式。 发布文本类数据集
  • NLP大模型支持接入的数据集类型 盘古NLP大模型仅支持接入文本类数据集,数据集文件内容包括:预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等,不同训练方式所需要使用的数据见表1,该数据集格式要求请参见文本类数据集格式要求。 表1 训练NLP大模型数据集类型要求 基模型 训练场景 数据集类型 数据集内容 文件格式 NLP 预训练 文本 预训练文本 jsonl 微调 文本 单轮问答 jsonl、csv 文本 多轮问答 jsonl 文本 单轮问答(人设) jsonl、csv 文本 多轮问答(人设) jsonl
  • 试运行工作流(必选) Agent开发平台支持对整个工作流进行试运行,也支持对工作流的单个节点进行调试。 试运行工作流: 工作流编排完成后,单击右上角“试运行”,在对话框中输入问题,等待返回试运行结果。 在试运行过程中,可以单击右上角“”查看调试结果,包括运行结果与调用详情。 如果试运行失败,常见报错与解决方案请详见Agent开发常见报错与解决方案。 图9 调试结果示例 单节点调试,以调试“意图识别”节点为例: 在工作流编排页面,单击意图识别节点的“”,进入单节点调试页面。 编写输入参数内容,单击“开始运行”。 图10 编写输入参数内容 可在“运行结果”页面查看当前节点的运行结果。 若运行成功,节点处也将显示“运行成功”字样。 图11 单节点调试运行成功示例
  • 判断节点配置说明 判断节点是一个IF-ELSE节点,提供了多分支条件判断的能力,用于设计分支流程。 当向该节点输入参数时,节点会判断输入是否符合“参数配置”中预设的条件,符合则执行“IF”对应的工作流分支,否则执行“ELSE”对应的工作流分支。 每个分支条件支持添加多个判断条件(且、或),同时支持添加多个条件分支。 判断节点为可选节点,若无需配置,可跳过该步骤。 判断节点配置步骤如下: 拖动左侧“判断”节点至画布中,单击该节点以打开节点配置页面。 参照表6,完成判断节点的配置。 表6 判断节点配置说明 配置类型 参数名称 参数说明 参数配置 IF IF分支由[参数名称 比较条件 比较对象 值]组成一条件表达式。 参数名称:条件表达式左边部分,需要选择来自前序节点的输出参数。 比较条件:条件表达式中间部分,当前支持的比较条件有:长度大于、长度大于等于、长度小于、长度小于等于、等于、不等于、包含、不包含、为空、不为空。其中,针对不同的参数名称,将展示不同的比较条件,具体可以前端页面为准。 比较对象、值:条件表达式右边部分,支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点输出变量值。 输入:支持用户自定义取值。 添加条件:单击“添加条件”,在当前分支添加多个条件表达式,多个条件表达式之间通过“且”或“或”来连接。 单击“且”或“或”,可以切换该分支表达式的运算逻辑。 ELSE 该参数将不满足其他条件分支的内容输出,并提供给后序节点的输出参数引用。 添加分支 可以添加新的分支ELSE IF,新分支的配置方式与IF分支相同。 图5 判断节点配置示例 节点配置完成后,单击“确定”。 连接判断节点和其他节点。
  • 消息节点配置说明 消息节点可提供中间过程的消息输出能力,通过定义一段文本内容,在工作流的执行过程中向用户发送该内容的消息。 消息节点配置步骤如下: 拖动左侧“消息”节点至画布中,单击该节点以打开节点配置页面。 参照表8,完成大模型节点的配置。 表8 消息节点配置说明 配置类型 参数名称 参数说明 参数配置 输入参数 参数名称:只允许输入字母、数字、下划线,且不能以数字开头。 类型、值:支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点的输出变量值。 输入:支持用户自定义取值。 指定回复 - 可撰写指定的回复信息,并以{{参数名称}}的形式插入变量。 节点配置完成后,单击“确定”。 连接消息节点和其他节点。
  • 知识检索节点配置说明 知识检索节点可以根据输入参数从指定知识库内召回匹配的信息,节点支持选择用户创建的知识库,创建步骤请详见创建知识库。 知识检索节点配置步骤如下: 拖动左侧“知识检索”节点至画布中,单击该节点以打开节点配置页面。 参照表9,完成大模型节点的配置。 表9 知识检索节点配置说明 配置类型 参数名称 参数说明 参数配置 输入参数 参数名称:输入参数固定只有1个,参数名称为query且不可修改。 类型、值:支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点的输出变量值。 输入:支持用户自定义取值。 知识库 支持上传用户所建立的知识库。 相关度阈值 超过相关度阈值的搜索结果会提交给大模型进行总结,否则被过滤,可以参考知识库中命中测试的相关度分值调整该阈值。 取值范围为0.01~0.99。 topk召回数量 召回的相关性阈值top切片数量,如topk召回数量为5,则相关性阈值为前5的切片将被召回提交给大模型总结。 取值范围为1~6。 输出参数 - 知识检索节点输出的参数output_list为一个数组,包含文档名称(document_name)、检索到的内容(content)以及得分(score)。 图7 知识检索节点配置示例 节点配置完成后,单击“确定”。 连接消息节点和其他节点。
  • 结束节点配置说明(必选) 结束节点是工作流的最终节点。当工作流执行完成后,需要结束节点用于输出工作流的执行结果。结束节点不支持新增或者删除,该节点后不支持添加其他节点。 结束节点可能会有多个输入,但是只能有一个输出值,因此需要开发者在“指定回复”中合并多个输入值为一个输出值。 结束节点为必选节点,需要配置于所有场景中。 结束节点配置步骤如下: 单击画布中的结束节点以打开节点配置页面。 参照表10,完成结束节点的配置。 表10 结束节点配置说明 配置类型 参数名称 参数说明 参数配置 输入参数 参数名称:只允许输入字母、数字、下划线,且不能以数字开头。 类型、值:支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点的输出变量值。 输入:支持用户自定义取值。 指定回复 - 可撰写指定的回复信息,并以{{参数名称}}的形式插入变量。 支持用户将多个输入变量合并成一个字符串输出,使用{{参数名称}}代指上述定义的输入参数。 例如,已定义输入参数end_input值为hello,定义“指定回复”内容为{{end_input}} world,则最终的输出即为hello world。 图8 结束节点配置示例 节点配置完成后,单击“确定”。 连接其他节点和结束节点。
  • 插件节点配置说明 插件节点使开发者可以在工作流中实现与外部环境的交互,以拥有更强大的能力,完成更复杂的任务。 插件类型包括预置插件和个人插件。 预置插件:平台预置了代码解释器插件,支持开发者直接将插件添加到工作流或应用中,丰富其能力。 自定义插件:平台允许开发者创建自定义插件,支持将API通过配置方式快速创建为插件,并供Agent调用。 插件节点为可选节点,若无需配置,可跳过该步骤。 插件节点配置步骤如下: 拖动左侧“插件”节点至画布中,在“个人插件”或“预置插件”页签单击“”,将插件添加至画布中。 预置插件为平台内置的插件 个人插件为用户自定义的插件,创建插件步骤详见创建插件。 单击画布中已添加的“插件”节点,参照表5,完成插件节点的配置。 表5 插件节点配置说明 配置类型 参数名称 参数说明 参数配置 输入参数 参数名称:从插件元信息中导入,用户无需手动添加。 类型、值:支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点的输出变量值。 输入:支持用户自定义取值。 输出参数 输出参数所有信息从插件元信息中导入,用户无需手动添加。 图4 插件节点配置示例 节点配置完成后,单击“确定”。 连接插件节点和其他节点。
  • 工作流介绍 Agent开发平台的工作流由多个节点构成,节点是组成工作流的基本单元。平台支持多种节点,包括开始、结束、大模型、意图识别、提问器、插件、判断、代码、知识检索和消息节点。 创建工作流时,每个节点需要配置不同的参数,如输入和输出参数等,开发者可通过拖、拉、拽可视化编排更多的节点,实现复杂业务流程的编排,从而快速构建应用。 工作流方式主要面向目标任务包含多个复杂步骤、对输出结果成功率和准确率有严格要求的复杂业务场景。 在编排工作流时,可以使用以下节点进行功能设计: 开始节点:开始节点是工作流的起始节点,用户输入的信息由开始节点传入。 结束节点:结束节点是工作流的最终节点,用于定义整个工作流的输出信息。 大模型节点:用于在工作流中引入大模型能力。 意图识别节点:用于根据用户的输入进行意图分类并导向后续不同的处理流程。 提问器节点:提供了在对话过程中向用户收集更多信息的能力。 插件节点:用于引入API插件,根据节点的输入,执行用户定义的插件,将插件执行结果作为节点的输出。 判断节点:编排应用时作为分支切换节点,可以根据输入满足的判断条件,指定执行对应的工作流分支。 代码节点:用于引入代码执行器,根据节点的输入,执行指定Python代码,节点的输出是代码执行的结果信息。 知识检索节点:可以根据输入参数从指定知识库内召回匹配的信息。 消息节点:定义一段文本内容,在工作流的执行过程中向用户发送该内容的消息。 父主题: 编排与调用工作流
  • 步骤2:配置提示词 创建应用后,需要撰写提示词(Prompt),为Agent设定人设、目标、核心技能、执行步骤。 应用会根据盘古NLP大模型对提示词的理解,来选择使用插件、工作流或知识库,响应用户问题。因此,一个好的提示词可以让模型更好地理解并执行任务,应用效果与提示词息息相关。 配置提示词步骤如下: 在“提示词”模块,需要在输入框中填写Prompt提示词。 可依据模板填写Prompt,单击“”,输入框中将自动填入角色指令模板。单击“”,可使用获取提示词模板中的提示词模板。 图1 提示词 提示词填写完成后可通过大模型进行优化,单击“”,可在 “Prompt优化”窗口中复制优化后的提示词,单击“确定”。 注意,使用智能优化提示词功能前,请先在页面右上角选择需要使用的模型。 图2 配置大模型
  • 步骤5:添加知识库 应用支持添加知识库。发送消息时,应用能够引用知识库中的内容回答用户问题,当前仅支持关联1个知识库。 如果需要添加知识库,请确保已完成创建知识库操作。 添加知识库的步骤如下: 在“知识库”模块,单击“”。 在“添加知识库”窗口,单击“”进行添加,再单击“确定”。 图6 添加知识库 添加知识库后,可在“知识库”中查看当前已添加的知识库。 图7 已添加知识库 可单击“”对知识库进行高级配置,包括相关度阈值与topk召回数量。 相关度阈值:超过相关度阈值的搜索结果会提交给大模型进行总结,否则被过滤,可以参考知识库中命中测试的相关度分值调整该阈值。 topk召回数量:召回的相关性阈值top切片数量,如topk召回数量为5,则相关性阈值为前5的切片将被召回提交给大模型总结。 图8 知识库高级配置
  • 步骤7:调试应用 创建应用后,平台支持对应用执行过程的进行预览与调试。 调试应用的步骤如下: 在页面右上角单击“”,参考表2配置大模型参数。 表2 大模型参数配置 参数 说明 模型选择 选择要使用的大模型,不同的模型效果存在差异。 该模型需提前部署,步骤请参见创建NLP大模型部署任务。 模式选择 用于配置大模型的输出多样性。 包含取值: 精确的:模型的输出内容严格遵循指令要求,可能会反复讨论某个主题,或频繁出现相同词汇。 平衡的:平衡模型输出的随机性和准确性。 创意性的:模型输出内容更具多样性和创新性,某些场景下可能会偏离主旨。 自定义:自定义大模型输出的温度和核采样值,生成符合预期的输出。 温度 调高温度会使得模型的输出更多样性和创新性,反之,降低温度会使输出内容更加遵循指令要求但减少多样性,取值范围为0到1之间。 调高温度,会使得模型的输出更多样性和创新性。 降低温度,会使输出内容更加遵循指令要求但减少多样性。 在基于事实的问答场景,可以使用较低的回复随机性数值,以获得更真实和简洁的答案;在创造性的任务例如小说创作,可以适当调高回复随机性数值。建议不要与核采样同时调整。 核采样 模型在输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到核采样值。核采样值可以限制模型选择这些高概率的词汇,从而控制输出内容的多样性,取值范围为0.1到1之间。 携带上下文轮数 设置带入模型上下文的对话历史轮数,轮数越多相关性越高。 输出模式 当前应用支持输出文本、Markdown两种模式的回答。 在右侧“预览调试”的文本框中输入对话,应用将根据对话生成相应的回答。 在调试过程中,单击右上角“调试”,可以查看当前会话或历史会话的运行结果与调用详情。 图9 查看调试结果
  • Agent开发平台简介 Agent开发平台是基于NLP大模型,致力打造智能时代集开发、调测和运行为一体的AI应用平台。无论开发者是否拥有大模型应用的编程经验,都可以通过Agent平台快速创建各种类型的智能体。Agent开发平台旨在帮助开发者高效低成本的构建AI应用,加速领域和行业AI应用的落地。 针对“零码”开发者(无代码开发经验),平台提供了Prompt智能生成、插件自定义等能力,方便用户快速构建、调优、运行属于自己的大模型应用,仅需几步简单的配置即可创建属于自己的Agent应用。 对于“低码”开发者(有一定代码开发经验),可以通过工作流方式,适当编写一定代码,来构建逻辑复杂、且有较高稳定性要求的Agent应用,开发者也可以灵活组合各个节点,包含大模型节点、意图识别节点、提问器节点、插件节点等,通过“拖拉拽”的方式快速搭建一个工作流。
  • Agent开发平台功能及优势 Agent开发平台具有能力扩展、自定义知识库、灵活的工作流设计和全链路信息调测评估等特点。 能力扩展:平台可以集成多种插件,插件能够有效扩展Agent的能力边界。 预置插件:平台当前为用户提供了“Python解释器”插件,支持开发者直接将插件添加到Agent中,丰富Agent的能力。 自定义插件:平台支持开发者创建自定义插件。支持开发者将工具、Function或者API通过配置方式快速创建为一个插件,并供Agent调用。 自定义知识库:平台提供了知识库功能来管理和存储数据,支持为AI应用提供自定义数据,并与之进行互动。多种格式的本地文档(支持docx、pptx、pdf等)都可以导入至知识库。 灵活的工作流设计:平台提供灵活的工作流设计,用于开发者处理逻辑复杂、且有较高稳定性要求的任务流。 支持“零码”和“低码”开发者通过“拖拉拽”的方式快速搭建一个工作流,创建一个应用。
  • Agent开发平台应用场景 当前,基于Agent开发平台可以构建两种类型的应用,一种是针对文本生成、文本检索的知识型Agent,如搜索问答助手、代码生成助手等,执行主体在大模型;另一种是针对复杂工作流场景的流程型Agent,如金融分析助手、网络检测助手等。 知识型Agent:以大模型为任务执行核心,用户通过配置Prompt、知识库等信息,实现工具自主规划与调用,优点是可零码开发,对话过程更为智能,缺点是当大模型受到输入限制,难以执行链路较长且复杂的流程。 流程型Agent:以工作流为任务执行核心,用户通过在画布上对节点进行“拖拉拽”即可搭建出任务流程,场景的节点包括大模型节点、意图识别节点、提问器节点、插件节点、判断节点、代码节点、消息节点,优点是可扩展能力强,用户适当使用低码开发,缺点是对话交互智能度不高,复杂场景下分支多,难以维护。
  • 提示词基本要素 您可以通过简单的提示词(Prompt)获得大量结果,但结果的质量与您提供的信息数量和完善度有关。一个提示词可以包含您传递到模型的指令或问题等信息,也可以包含其他种类的信息,如上下文、输入或示例等。您可以通过这些元素来更好地指导模型,并因此获得更好的结果。提示词主要包含以下要素: 指令:希望模型执行的特定任务或指令,如总结、提取、生成等。 上下文:包含外部信息或额外的上下文信息,引导语言模型更好地响应。 输入数据:用户输入的内容或问题。 输出指示:指定输出的类型或格式。 提示词所需的格式取决于您希望语言模型完成的任务类型,并非所有以上要素都是必须的。
  • 提示词工程使用流程 ModelArts Studio大模型开发平台可以辅助用户进行提示词撰写、比较和评估等操作,并对提示词进行保存和管理。 表1 功能说明 功能 说明 提示词工程任务管理 提示词工程平台以提示词工程任务为管理维度,一个任务代表一个场景或一个调优需求,在提示词工程任务下可以进行提示词的调优、比较和评估。 提示词工程任务管理支持工程任务的创建、查询、修改、删除。 提示词撰写 提示词调优支持对提示词文本的编辑、提示词变量设置、提示词结果生成和调优历史记录管理。 提示词候选 提示词候选支持用户对调优后初步筛选的提示词进行候选管理,每个工程任务下可以保存上限9个候选提示词,进一步基于候选提示词进行比较和评估。 提示词比较 提示词比较支持选择两个候选提示词对其文本和参数进行比较,支持对选择的候选提示词设置相同变量值查看效果。 提示词评估 提示词评估以任务维度管理,支持评估任务的创建、查询、修改、删除。支持创建评估任务,选择候选提示词和需要使用的变量数据集,设置评估算法,执行任务自动化对候选提示词生成结果和结果评估。 提示词管理 提示词管理支持用户对满意的候选提示词进行保存管理,同时支持提示词的查询、删除。 图1 提示词工程使用流程
  • 提示词工程简介 提示词工程(Prompt Engineering)是一个较新的学科,应用于开发和优化提示词(Prompt),帮助用户有效地将大语言模型用于各种应用场景和研究领域。掌握提示词工程相关技能将有助于用户更好地了解大语言模型的能力和局限性。 提示词工程不仅是关于设计和研发提示词,它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。用户可以通过提示词工程来提高大语言模型的安全性,还可以赋能大语言模型,如借助专业领域知识和外部工具来增强大语言模型的能力。
  • 预测类数据集格式要求 平台支持创建预测类数据集,创建时可导入时序数据、回归分类数据。 时序数据:时序预测数据是一种按时间顺序排列的数据序列,用于预测未来事件或趋势,过去的数据会影响未来的预测。 回归分类数据:回归分类数据包含多种预测因子(特征),用于预测连续变量的值,与时序数据不同,回归分类数据不要求数据具有时间顺序。 具体格式要求详见表1。 表1 预测类数据集格式要求 文件内容 文件格式 文件样例 时序 csv 数据为结构化数据,包含列和行,每一行表示一条数据,每一列表示一个特征,并且必须包含预测目标列,预测目标列要求为连续型数据。 目录下只有1个数据文件时,文件无命名要求。 目录下有多个数据文件时,需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字样,如train01.csv;验证数据名称需包含eval字样;测试数据名称需包含test字样。文件的命名不能同时包含train、eval和test中的两个或三个。 时序预测必须要包含一个时间列,时间列值的格式示例为 2024-05-27 或 2024/05/27 或 2024-05-27 12:00:00 或 2024/05/27 12:00:00 。 示例如下: timestamp,feature1,feature2,target 2024-05-27 12:00:00,10.5,20.3,100 2024-05-27 12:01:00,10.6,20.5,101 2024-05-27 12:02:00,10.7,20.7,102 2024-05-27 12:03:00,10.8,20.9,103 2024-05-27 12:04:00,10.9,21.0,104 单个文件大小不超过50GB,文件数量最多1000个。 回归分类 csv 数据为结构化数据,包含列和行,每一行表示一条数据,每一列表示一个特征,并且必须包含预测目标列,预测目标列要求为连续型数据。 目录下只有1个数据文件时,文件无命名要求。 目录下有多个数据文件时,需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字样,如train01.csv;验证数据名称需包含eval字样;测试数据名称需包含test字样。文件的命名不能同时包含train、eval和test中的两个或三个。 示例如下: feature1,feature2,target 10.5,20.3,100 10.6,20.5,101 10.7,20.7,102 10.8,20.9,103 10.9,21.0,104 单个文件大小不超过50GB,文件数量最多1000个。 父主题: 数据集格式要求
  • 数据工程介绍 数据工程是ModelArts Studio大模型开发平台(下文简称“平台”)为用户提供的一站式数据处理与管理功能,旨在通过系统化的数据获取、加工、发布等过程,确保数据能够高效、准确地为大模型的训练提供支持,帮助用户高效管理和处理数据,提升数据质量和处理效率,为大模型开发提供坚实的数据基础。 数据工程包含的具体功能如下: 数据获取:数据获取是数据工程的第一步,支持将不同来源和格式的数据导入平台,并生成“原始数据集”。 支持的接入方式:通过OBS服务导入数据。 支持的数据类型:文本、图片、视频、气象、预测、其他。 通过这些功能,用户可以轻松将大量数据导入平台,为后续的数据加工和模型训练等操作做好准备。 数据加工:平台提供了数据加工、数据合成、数据标注、数据配比的加工操作,旨在确保原始数据能够满足各种业务需求和模型训练的标准,生成“加工数据集”。 数据加工:数据加工旨在通过使用数据集加工算子对数据进行预处理操作,针对不同类型的数据集,平台设计了专用的加工算子,以确保数据符合模型训练的标准和业务需求。 数据合成:数据合成利用预置或自定义的数据指令对原始数据集进行处理,并根据设定的轮数生成新的数据。 数据标注:数据标注旨在为无标签的数据集添加准确的标签,标注数据的质量直接影响模型的训练效果和精度。针对不同数据集平台支持人工标注与AI预标注两种形式。 其中,图片Caption、视频Caption标注项支持AI预标注功能。 数据配比:将多个数据集按照特定比例关系组合并为一个“加工数据集”的过程,确保数据的多样性、平衡性和代表性。 通过数据加工操作,平台能够有效清理噪声数据、标准化数据格式,提升数据集的整体质量。 数据发布:平台提供了数据评估、数据发布操作,旨在通过数据质量评估确保数据满足大模型训练的多样性、平衡性和代表性需求,并促进数据的高效流通与应用,生成“发布数据集”。 数据评估:数据评估通过对数据集进行系统的质量检查,依据评估标准评估数据的多个维度,旨在发现潜在问题并加以解决。 数据发布:将单个数据集发布为特定格式的“发布数据集”的过程,用于后续模型训练等操作。 支持发布的数据集格式为标准格式、盘古格式(适用于训练盘古大模型时)。目前,仅文本类和图片类数据集支持发布为“盘古格式”。 在集成了数据获取、数据加工、数据发布功能外,平台还支持对原始数据集、加工数据集、发布数据集、数据合成指令进行一站式管理。在大规模数据集的构建过程中,ModelArts Studio大模型开发平台的数据工程功能为用户提供了极大的灵活性和高效性,确保了数据处理的各个环节都能紧密协作,快速响应不断变化的业务需求和技术要求。
  • 请求示例 对一个BPM实例修改或设置,设置其中两个开发者自定义的参数值,将变量cpuNumber的值改为1, custVar1的值改为value1。被操作的BPM实例ID是“002N000000Q3QW4IMAOO”。 PUT https://华为云Astro轻应用 域名 /u-route/baas/bp/v2.0/runtime/instances/002N000000Q3QW4IMAOO/variables { "cpuNumber":1, "custVar1":"value1" }
  • URI PUT 华为云Astro轻应用域名/u-route/baas/bp/v2.0/runtime/instances/{instance_id}/variables 表1 路径参数 参数 是否必选 参数类型 描述 instance_id 是 String 参数解释: 对应一个具体BPM实例的标识,可通过调用查询BPM实例接口查看(响应消息中的“id”)。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全