华为云用户手册

  • 训练相关概念 表2 训练相关概念说明 概念名 说明 自监督学习 自监督学习(Self-Supervised Learning,简称SSL)是一种机器学习方法,它从未标记的数据中提取监督信号,属于无监督学习的一个子集。该方法通过创建“预设任务”让模型从数据中学习,从而生成有用的表示,可用于后续任务。它无需额外的人工标签数据,因为监督信号直接从数据本身派生。 有监督学习 有监督学习是机器学习任务的一种。它从有标记的训练数据中推导出预测函数。有标记的训练数据是指每个训练实例都包括输入和期望的输出。 LoRA 局部微调(LoRA)是一种优化技术,用于在深度学习模型的微调过程中,只对模型的一部分参数进行更新,而不是对所有参数进行更新。这种方法可以显著减少微调所需的计算资源和时间,同时保持或接近模型的最佳性能。 过拟合 过拟合是指为了得到一致假设而使假设变得过度严格,会导致模型产生“以偏概全”的现象,导致模型泛化效果变差。 欠拟合 欠拟合是指模型拟合程度不高,数据距离拟合曲线较远,或指模型没有很好地捕捉到数据特征,不能够很好地拟合数据。 损失函数 损失函数(Loss Function)是用来度量模型的预测值f(x)与真实值Y的差异程度的运算函数。它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。
  • 大模型开发基本流程介绍 大模型(Large Models)通常指的是具有海量参数和复杂结构的深度学习模型,广泛应用于自然语言处理(NLP)等领域。开发一个大模型的流程可以分为以下几个主要步骤: 数据集准备:大模型的性能往往依赖于大量的训练数据。因此,数据集准备是模型开发的第一步。首先,需要根据业务需求收集相关的原始数据,确保数据的覆盖面和多样性。例如,若是自然语言处理任务,可能需要大量的文本数据;如果是计算机视觉任务,则需要图像或视频数据。 数据预处理:数据预处理是数据准备过程中的重要环节,旨在提高数据质量和适应模型的需求。常见的数据预处理操作包括: 去除重复数据:确保数据集中每条数据的唯一性。 填补缺失值:填充数据中的缺失部分,常用方法包括均值填充、中位数填充或删除缺失数据。 数据标准化:将数据转换为统一的格式或范围,特别是在处理数值型数据时(如归一化或标准化)。 去噪处理:去除无关或异常值,减少对模型训练的干扰。 数据预处理的目的是保证数据集的质量,使其能够有效地训练模型,并减少对模型性能的不利影响。 模型开发:模型开发是大模型项目中的核心阶段,通常包括以下步骤: 选择合适的模型:根据任务目标选择适当的模型。 模型训练:使用处理后的数据集训练模型。 超参数调优:选择合适的学习率、批次大小等超参数,确保模型在训练过程中能够快速收敛并取得良好的性能。 开发阶段的关键是平衡模型的复杂度和计算资源,避免过拟合,同时保证模型能够在实际应用中提供准确的预测结果。 应用与部署:当大模型训练完成并通过验证后,进入应用阶段。主要包括以下几个方面: 模型优化与部署:将训练好的大模型部署到生产环境中,可能通过云服务或本地服务器进行推理服务。此时要考虑到模型的响应时间和并发能力。 模型监控与迭代:部署后的模型需要持续监控其性能,并根据反馈进行定期更新或再训练。随着新数据的加入,模型可能需要进行调整,以保证其在实际应用中的表现稳定。 在应用阶段,除了将模型嵌入到具体业务流程中外,还需要根据业务需求不断对模型进行优化,使其更加精准和高效。 父主题: 基础知识
  • Agent开发 Agent开发平台为开发者提供了一个全面的工具集,帮助您高效地开发、优化和部署应用智能体。无论您是新手还是有经验的开发者,都能通过平台提供的提示词工程、插件扩展、灵活的工作流设计和全链路调测功能,快速实现智能体应用的开发与落地,加速行业AI应用的创新与应用。 对于零码开发者(无代码开发经验的用户): 平台提供了Prompt提示词工程和插件自定义等功能,帮助用户在无需编写代码的情况下,快速构建、调优并运行属于自己的大模型应用。通过简单的配置,用户可以轻松创建Agent应用,快速体验智能化应用的便捷性。 平台提供导入知识功能,支持用户存储和管理数据,并与AI应用进行互动。支持多种格式的本地文档(如docx、pptx、pdf等),方便导入至知识,为Agent应用提供个性化数据支持。 平台还提供全链路信息观测和调试工具,支持开发者深入分析Agent执行过程中的每个环节。通过对信息进行分层展示,帮助开发者优化AI应用的性能和稳定性,确保应用在不同环境下的顺畅运行。 对于低码开发者(具有一定代码开发经验的用户): 基于上述功能,平台还提供了灵活的工作流设计功能,支持用户编写少量代码来构建逻辑复杂、稳定性要求高的Agent应用。通过拖拉拽方式,开发者可以组合各种组件(如大模型、代码、意图识别等),快速搭建工作流,实现更高效的应用开发。 平台还提供全链路信息观测和调试工具,支持开发者深入分析工作流执行过程中的每个环节。通过对信息进行分层展示,帮助开发者优化AI应用的性能和稳定性,确保应用在不同环境下的顺畅运行。 父主题: 产品功能
  • 数据工程 ModelArts Studio开发平台提供了全面的数据工程功能。该模块涵盖数据获取、加工、标注、评估和发布等关键环节,帮助用户高效构建高质量的训练数据集,推动AI应用的成功落地。具体功能如下: 数据获取:用户可以轻松将多种类型的数据导入ModelArts Studio大模型开发平台,支持的数据类型包括文本、图片、视频、气象、预测数据以及用户自定义的其他类型数据。平台提供灵活的数据接入方式以及支持多种文件格式导入,确保不同业务场景下的数据获取需求得到满足。 数据加工:平台提供强大的数据加工功能,可以对文本、视频、图片、气象类型的数据进行数据提取、过滤、转换、打标签和评分等加工处理。针对不同类型的数据集,平台提供了专用的清洗算子以及支持用户创建自定义算子实现个性化的数据清洗诉求。确保生成高质量的训练数据以满足业务需求和模型训练的要求。用户还可以灵活地调整算子编排顺序以及自定义清洗模板,有效提升数据清洗效率并支持大规模数据处理,确保生成的数据集符合训练的标准。 数据合成:平台支持利用预置或自定义的数据指令对预训练文本、单轮问答、单轮问答(人设))数据集类型进行处理,并根据设定的轮数生成新数据。通过数据合成技术,可以生成大量高质量的训练数据,这些数据可以用于大模型的预训练,增强模型的泛化能力和性能。 数据标注:平台支持对无标签的数据添加标签或对现有的标签进行重新标注,以提升数据集的标注质量。用户可以针对不同的数据集灵活地选择对应的标注项,还可以自定义选择多人标注、审核以及标注任务移交。针对文本和图片类数据集,平台还提供AI预标注功能。利用盘古大模型的智能能力,显著降低人工标注的工作量和成本,从而显著地提高标注效率。 数据评估:平台支持对处理后的文本、图片、视频等多种格式数据进行质量评估,并预置了基础的评估标准,用户可以直接使用预置标准或创建自定义评估标准,以满足个性化的数据质量需求。最终生成详细的质量评估报告,这些报告能够帮助用户检验数据的准确性、完整性和一致性,确保数据在进行模型训练前的高质量标准,以保证模型在实际应用中的可靠性和稳定性。 数据配比:平台支持对文本、图片类数据进行数据配比。用户在勾选数据集时可以勾选多条,通过调整不同来源或类型数据的比例,以优化模型训练过程。通过数据配比可以确保模型能够更全面地学习和理解数据的多样性,提高模型的泛化能力和性能。 数据发布:平台支持数据集发布。用户可以将处理后的数据集发布为多种格式,包括标准格式和盘古格式。尤其对于文本类和图片类数据集,平台支持将其转换为专门用于训练盘古大模型的盘古格式,为后续模型训练提供高效的数据支持。 数据管理:平台支持数据全链路血缘追溯,用户单击数据集名称可以在“数据血缘”页签,查看该数据集所经历的操作。全链路血缘追溯可以帮助用户正向实现数据集影响分析,逆向实现快速问题追踪,提升数据运维和 数据治理 的效率,帮助用户更好地对数据进行追根溯源。另外平台还提供了完善的标签体系、支持数据按行业标准进行分类、按行业标准进行安全分级、内置场景分类标签。帮助用户进行数据分类、数据质量控制和数据资产管理,提升数据治理的效率和效果。 通过整合上述功能,数据工程在AI研发中不仅帮助用户高效构建高质量的训练数据集,还通过全流程的数据处理和管理,探索数据与模型性能的内在联系,为模型训练和应用提供坚实的数据基础,推动了模型的精确训练与持续优化,提升了AI应用开发的效率和成果的可靠性。 父主题: 产品功能
  • 空间管理 ModelArts Studio大模型开发平台为用户提供了灵活且高效的空间资产管理方式。平台支持用户根据不同的使用场景、项目类别或团队需求,自定义创建多个工作空间。每个工作空间都是完全独立的,确保了工作空间内的资产不受其他空间的影响,从而保障数据和资源的隔离性与安全性。用户可以根据需求灵活划分工作空间,实现资源的有序管理与优化配置,确保各类资源在不同场景中的最大化利用。为进一步优化资源的管理,平台还提供了多种角色权限体系。用户可以根据自身角色从管理者到各模块人员进行不同层级的权限配置,确保每个用户在其指定的工作空间内,拥有合适的访问与操作权限。这种精细化的权限管理方式,既保证了数据的安全性,又提高了资源的高效利用。 在平台中,空间资产指的是存储在工作空间中的所有资源,包括数据资产和模型资产。这些资产是用户在平台上进行开发和管理的基础,集中存储和统一管理的方式有助于提升操作效率,并确保资源的规范性与安全性。 数据资产:数据资产是指用户在平台上发布的所有数据集。这些数据集会被存储在数据资产中,用户可以随时查看数据集的详细信息,如数据格式、大小、配比比例等,同时平台会自动记录每个数据集的操作历史,例如创建、发布及上线等过程。为了进一步简化管理,平台还支持数据集的删除功能,使用户能够对数据集进行灵活管理和调整。在模型训练和数据分析过程中,用户可以根据需求调用这些数据集,确保数据的准确性与安全性,从而提升数据资产的利用率。同时支持数据集发布到Gallery,支持从Gallery订阅数据集。 模型资产:模型资产包括用户试用、订购或在平台上训练后发布的模型,这些模型统一存储在模型资产中,便于集中管理。用户可以查看模型的所有历史版本及操作记录,从而了解模型的演变过程。同时,平台支持一系列便捷的模型操作,如模型训练、压缩和部署,帮助用户简化模型开发和应用流程。此外,平台还提供了导入和导出功能,支持用户将其他局点的盘古大模型迁移到本地局点,这使得模型资产在不同局点间的共享和管理变得更加灵活高效。同时支持模型发布到Gallery,支持从Gallery订阅模型。 通过统一管理空间资产,平台不仅帮助用户高效组织和利用资源,还保障了资产的安全性、一致性与灵活性。这些功能的结合,确保了平台上资源的高效利用与智能配置,为用户提供了更为便捷的开发和管理体验。 父主题: 产品功能
  • 盘古大模型服务简介 盘古大模型服务包含盘古基础大模型、盘古行业大模型与ModelArts Studio工具链平台,盘古基础大模型提供NLP、多模态、CV、预测、科学计算五大盘古基础模型与三方模型的模型服务,盘古行业大模型提供基于盘古基础大模型训练的行业大模型,涉及金融、政府、油气、矿山、电力、制造、交通、医学等行业领域。ModelArts Studio是一站式大模型工具链平台,支持百模千态,打造数据、模型、应用三引擎的大模型开发平台。盘古大模型服务将提供有竞争力的基础模型和适配行业的L1大模型,更提供易用、好用的工具链平台,成为行业首选的大模型供应商。 数据工程工具链 数据是大模型训练的基础,为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分,具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据发布和管理等功能。 该工具链能够高效收集和处理各种格式的数据,满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能力,对原始数据进行优化,确保其质量和一致性。同时,数据工程工具链还提供强大的数据存储和管理能力,为大模型训练提供高质量的数据支撑。 模型开发工具链 模型开发工具链是盘古大模型服务的核心组件,提供从模型创建到部署的一站式解决方案。 该工具链具备模型训练、压缩、部署、评测、推理等功能,通过高效的推理性能和跨平台迁移工具,模型开发工具链能够保障模型在不同环境中的高效应用。 Agent开发工具链 应用开发工具 链是盘古大模型平台的关键模块,支持提示词工程和智能Agent应用创建。该工具链提供提示词设计和管理工具,优化大模型的输入提示,提升输出的准确性和相关性。通过可视化编排工具,应用开发工具链加速大模型应用的开发,满足复杂业务需求。
  • 盘古模型与ModelArts Studio开发平台关系 盘古NLP、多模态、CV、预测、科学计算、专业大模型及第三方模型能力通过ModelArts Studio大模型开发平台承载,用户在平台上可以使用自己的数据增训和微调模型,可对训练的模型进行压缩、评测、部署,也可以在平台上创建自己的Agent应用。 ModelArts Studio大模型开发平台是盘古大模型服务推出的集数据工程、模型开发、Agent开发为一体的一站式大模型开发平台及大模型应用开发平台,提供覆盖全生命周期的大模型工具链。数据工程套件预置了60+数据处理AI算子,可以满足用户多种任务场景需求,极大提升用户数据处理效率,为大模型训练提供高质量数据;模型开发套件支持对盘古大模型及三方大模型进行微调、压缩、评测、部署,极大的降低了大模型开发门槛;Agent开发套件提供基于大语言模型的可视化流程编排能力,结合丰富的功能插件配置,极大的提升了大模型应用开发效率;面向工业应用开发场景,沉淀了20多个组件和场景化模板,5分钟快速创建行业生产级应用。同时,ModelArts Studio平台,对数据、模型、应用和Agent在统一的入口进行管理,可以快速掌握资产的使用情况、版本情况和溯源信息等,能够让用户更加方便地进行统一管控和资产管理。
  • 响应示例 响应返回一个字典,键为本次请求的输入图像的编号,对输入的图像按顺序从0开始编号;值为一个列表,列表里为该图像的预测结果,每张图像可能存在多个预测结果(例如多标签分类模式)。 { "0": [ { "label": "bird", "score": "0.95511043" }, { "label": "blackbird", "score": "0.75241840" }, ], "1": [ { "label": "bird", "score": "0.36211243" } ], "dataset_id": "1341002014632579072" }
  • 请求示例 单图请求示例 { "images": "/9j/4Vr2RXhpZgAASUkqAAgAAA.....", } 批量请求示例(单次请求批次上限为24张图) { "images": ["/9j/4Vr2RXhpZgAASUkqAAgAAA.....", "/9j/4RIrRXhpZgAATU......"] } 带高级参数的单标签分类请求示例 { "images": ["/9j/4Vr2RXhpZgAASUkqAAgAAA.....", "/9j/4RIrRXhpZgAATU......"], "top": 3 } 带高级参数的多标签分类请求示例 { "images": ["/9j/4Vr2RXhpZgAASUkqAAgAAA.....", "/9j/4RIrRXhpZgAATU......"], "threshold": { "bird": 0.33, "blackbird": 0.44 } }
  • 响应参数 状态码: 200 响应成功返回的结构体是一个Dict,由本次请求的多张输入图像的预测结果组成,图像与图像之间通过编号(键)区分。 表5 单/多标签分类响应成功Body参数 参数 参数类型 描述 键 String 输入图像的顺序编号,从"0"开始,最大不超过"23"。 值 List[Dict] 当前编号的图像对应的预测结果。 dataset_id String 训练数据集ID。 其中,每张图像的预测结果参数类型为List[Dict],表示预测得到的一个或多个类别,每个Dict的参数内容请参考表6。 表6 单张图像的单个类别预测结果参数 参数 参数类型 描述 label String 预测的类别,与训练数据中定义的类别相同。 score String 预测的置信度结果,输出每个标签对应的预测得分,得分区间为0至1。 状态码: 400 表7 响应失败Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。
  • 响应示例 { "data": [ { "prediction":{ "label": 0 } } ], "time_cost": { "infer_cost_time": "82.609 ms", "postprocess_cost_time": "0.29 ms", "preprocess_cost_time": "0.1332 ms", "service_cost_total_time": "84.965 ms" } }
  • 请求示例 { "context_len": 256, "data": [ { "context": { "feature_0": [ 864.1618041992188, 493.91827392578125, 252.7724151611328,...] } }, { "context": { "feature_0": [ 864.1618041992188, 493.91827392578125, 252.7724151611328,...] } } ] }
  • 请求参数 使用Token认证方式的请求Header参数见表2。 表2 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。 获取Token 接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表3。 表3 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表4 请求Body参数 参数 是否必选 参数类型 描述 data 是 Array 参数解释: 时序数据请求的批处理队列。 约束限制: 盘古时序预测分类任务的输入数据内容,用字典承载。输入数据字典中,键对应特征列名,值为序列数据具体内容。 取值范围: 输入数据中的一行数据。 默认取值: 预测大模型在训练完成后,可以在训练日志页面,“模型训练”日志节点中获取推理api所用的示例数据。填写请求Body时可以参考该示例填写。 context_len 否 int 参数解释: 时序任务的数据窗口大小,该参数主要服务于支持多尺度窗口的模型的推理。 约束限制: 填写时需要保证输入序列长度大于等于该值。 取值范围: min:32 max:512 -1为当前服务模型的默认大小。 默认取值: 128
  • 响应参数 状态码: 200 表5 响应成功Body参数 参数 参数类型 描述 result Array of objects 识别结果信息。 Score Float 置信度。 label String 检测类别。 Box Dict 检测到的目标主体信息。 表6 Box 参数 参数类型 描述 X Int 矩形框左上角横坐标。 Y Int 矩形框左上角纵坐标。 With Int 矩形框宽度。 Height Int 矩形框高度。 Angle Int 检测到的目标主体区域的角度。 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。
  • 响应示例 { "result": [ { "Box": { "Angle": 0, "Height": 60, "Width": 106, "X": 852, "Y": 182 }, "Score": 0.88427734375, "label": "car" }, { "Box": { "Angle": 0, "Height": 114, "Width": 55, "X": 800, "Y": 170 }, "Score": 0.70556640625, "label": "person" } ] }
  • 响应消息体 响应消息体通常以结构化格式返回,与响应消息头中Content-Type对应,传递除响应消息头之外的内容。 接口调用成功后将返回如下响应体。 { "id": "180f5745-4ee4-42a9-9869-23f829654bb7", "created": 1724915285, "choices": [ { "index": 0, "text": "故事标题:《穿越宋朝的奇妙之旅》在一个阴雨绵绵的夜晚,一个名叫李晓的年轻人正在阅读一本关于宋朝的历史书籍。突然,他感到一阵眩晕,当他再次睁开眼睛时,他发现自己身处一个完全陌生的地方。李晓发现自己穿越到了宋朝。他身处一座繁华的城市,人们穿着古代的服饰,用着他听不懂的语言交谈。他意识到自己真的穿越了。李晓在宋朝的生活充满了挑战。他必须学习如何使用新的语言,适应新的生活方式。他开始学习宋朝的礼仪,尝试理解这个时代的文化。在宋朝,李晓遇到了许多有趣的人。他遇到了一位名叫赵敏拿来的小女孩,她聪明伶俐,让李晓对她产生了深深的喜爱。他还遇到了一位名叫王安石的大儒,他的智慧和博学让李晓深感敬佩。在宋朝的生活中,李晓也遇到了许多困难。他必须适应新的食物,新的气候,甚至新的疾病。但是,他从未放弃,他始终坚信,只要他坚持下去,他就能适应这个新的世界。在宋朝的生活中,李晓也找到了新的目标。他开始学习宋朝的书法,尝试理解这个时代的艺术。他还开始学习宋朝的医学,尝试理解这个时代的科学。在宋朝的生活中,李晓也找到了新的爱情。他与赵敏拿来建立了深厚的感情,他们的conseillé情深深地打动了李晓。最后,李晓决定留在宋朝。他发现,他已经深深地爱上了这个时代,爱上了这里的人,爱上了这里的食物,爱上了这里的一切。这就是李晓在宋朝的hesion之旅,一个充满挑战和机遇的旅程。虽然他来自未来,但他已经成为了宋朝的一部分,成为了这个时代的一部分。", "ppl": 1.77809815678146e-36 } ], "usage": { "completion_tokens": 365, "prompt_tokens": 9, "total_tokens": 374 } } 当接口调用出错时,会返回错误码及错误信息说明。 token有效期为24小时,下面的报错表示token过期。 { "error_msg": "Incorrect IAM authentication information: token expires, expires_at:2023-06-29T02:16:41.581000Z", "error_code": "APIG.0301", "request_id": "469967f55e6b225xxx" } 其中,error_code表示错误码,error_msg表示错误描述信息。
  • 响应参数 状态码: 200 表5 响应Body参数 参数 参数类型 描述 result List 物体检测的识别结果。 表6 响应Body参数 参数 参数类型 描述 RegisterMatrix List 默认为[[1, 0, 0], [0, 1, 0], [0, 0, 1]],表示图片特征矩阵。 Label String 预测类别。 Score Float 置信度。 Box Dict 检测到的目标主体信息,格式为{"x":x1,"y":y1,"width":w,"height":h,'Angle':angle}。 x:检测到的目标主体区域的左上角x坐标。 y:检测到的目标主体区域的左上角y坐标。 width:检测到的目标主体区域的宽度。 height:检测到的目标主体区域的高度。 angle: 检测到的目标主体区域的角度。 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。
  • 响应示例 { "result": [ { "RegisterMatrix": [ [ 1, 0, 0 ], [ 0, 1, 0 ], [ 0, 0, 1 ] ] }, { "Box": { "Y": 0, "Width": 100, "Angle": 0, "X": 0, "Height": 100 }, "Score": 0.9, "label": "person" } ] }
  • 请求示例 { "name" : "demo-task", "input" : { "type" : "obs", "data" : [ { "bucket" : "bucket", "path" : "path/to/directory/" } ] }, "output" : { "obs" : { "bucket" : "bucket", "path" : "path/to/directory/" } }, "config" : { "start_time_begin" : 2017010100, "start_time_end" : 2017010200, "start_time_interval_hours" : 1, "forecast_lead_hours" : 1, "num_ensembles" : 2, "ensemble_noise_method" : "perlin", "ensemble_noise_perlin_scale" : 0.1, "ensemble_noise_perlin_octave" : 1, "ensemble_noise_perlin_x" : 0.2, "ensemble_noise_perlin_y" : 0.2, "draw_figures" : "true" } }
  • 请求参数 使用Token认证方式的请求Header参数见表2。 表2 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表3。 表3 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表4 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 推理作业的名称。 input 是 TaskInputDto object 输入数据的信息。 output 是 TaskOutputDto object 输出数据的信息。 config 是 TaskConfigDto object 科学计算大模型配置信息。 表5 TaskInputDto 参数 是否必选 参数类型 描述 type 是 String 存储类型,取值为obs。 data 是 Array of ObsStorageDto objects 输入数据的OBS信息。 表6 ObsStorageDto 参数 是否必选 参数类型 描述 bucket 是 String 输入数据的OBS桶名称。 path 是 String 初始场数据的存放路径。 表7 TaskOutputDto 参数 是否必选 参数类型 描述 obs 是 ObsStorageDto object 输出数据的OBS信息。 表8 TaskConfigDto 参数 是否必选 参数类型 描述 start_time_begin 是 String 起报时间区间起点(YYYYMMDDHH时间戳)。 start_time_end 是 String 起报时间区间终点(YYYYMMDDHH时间戳)。 start_time_interval_hours 否 Long 起报时间间隔小时数,默认6。取值范围:[1, 24]。 forecast_lead_hours 否 Long 预报未来小时数,默认168,取值范围:[1, 720]。 draw_figures 否 String 是否输出结果图片,取值true/false,默认true。 num_ensembles 否 Long 集合数量。在气象预报中,集合预报是指对初始场加入一定程序的扰动,使其生成一组由不同初始场预报的天气预报结果,从而提供对未来天气状态的概率信息。这种方法可以更好地表达预报的不确定性,从而提高预报的准确性和可靠性。 取值范围:[2, 10]。 ensemble_noise_method 否 String 集合预报的加噪方式。可选:{"perlin"}。 peilin噪音通过对输入数据(比如空间坐标)进行随机扰动,让模拟出的天气接近真实世界中的变化。 ensemble_noise_perlin_scale 否 Double 集合预报的Perlin加噪scale。取值范围:(0, 0.5)。 ensemble_noise_perlin_octave 否 Long 用于选择集合预报的Perlin加噪octave。Perlin噪音的octave指的是噪音的频率,在生成Perlin噪音时,可以将多个不同频率的噪音叠加在一起,以增加噪音的复杂度和细节。每个频率的噪音称为一个octave,而叠加的octave数越多,噪音的复杂度也就越高。 取值范围:[1, 10)。 ensemble_noise_perlin_x 否 Double 用于选择集合预报的Perlin加噪x经度方向的尺度。 取值范围:[0, 1)。 ensemble_noise_perlin_y 否 Double 用于选择集合预报的Perlin加噪y纬度方向的尺度。 取值范围:[0, 1)。 表9 全球中期天气要素预测模型、降水模型信息表 模型 预报层次 预报高空变量 预报表面变量 降水 时间分辨率 水平分辨率 区域范围 全球中期天气要素预测模型 13层(1000hpa, 925hpa, 850hpa, 700hpa, 600hpa, 500hpa, 400hpa, 300hpa, 250hpa, 200hpa, 150hpa, 100hpa, 50hpa) T:温度 Q:比湿 Z:重力位势 U:U风 V:V风 MLSP:海平面气压 U10:10米U风,经度方向 V10:10米V风,纬度方向 T2M:2米温度 - 1、3、6、24小时 0.25°*0.25° 全球 降水基模型 13层(1000hpa, 925hpa, 850hpa, 700hpa, 600hpa, 500hpa, 400hpa, 300hpa, 250hpa, 200hpa, 150hpa, 100hpa, 50hpa) T:温度 Q:比湿 Z:重力位势 U:U风 V:V风 MLSP:海平面气压 U10:10米U风,经度方向 V10:10米V风,纬度方向 T2M:2米温度 PRECIP6:过去6h累计降水 PRECIP24:过去24h累计降水 1、3、6、24小时 0.25°*0.25° 全球
  • 请求示例 非流式 POST https://{endpoint}/v1/{project_id}/alg-infer/3rdnlp/service/{deployment_id}/v1/chat/completions Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... Request Body: { "model":"DeepSeek-V3", "messages":[ { "role":"user", "content":"你好" }] } 流式(stream参数为true) POST https://{endpoint}/v1/{project_id}/alg-infer/3rdnlp/service/{deployment_id}/v1/chat/completions Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... Request Body: { "model":"DeepSeek-V3", "messages":[ { "role":"user", "content":"你好" }], "stream":true }
  • 响应示例 非流式 状态码: 200 OK { "id": "chat-9a75fc02e45d48db94f94ce38277beef", "object": "chat.completion", "created": 1743403365, "model": "DeepSeek-V3", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "你好!有什么我可以帮助你的吗?", "tool_calls": [] }, "finish_reason": "stop" } ], "usage": { "prompt_tokens": 64, "total_tokens": 73, "completion_tokens": 9 } } 流式(stream参数为true) 状态码: 200 OK data:{"id":"chat-97313a4bc0a342558364345de0380291","object":"chat.completion.chunk","created":1743404317,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"role":"assistant"},"logprobs":null,"finish_reason":null}] data:{"id":"chat-97313a4bc0a342558364345de0380291","object":"chat.completion.chunk","created":1743404317,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"你好"},"logprobs":null,"finish_reason":null}]} data:{"id":"chat-97313a4bc0a342558364345de0380291","object":"chat.completion.chunk","created":1743404317,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":",有什么我能帮您的吗?"},"logprobs":null,"finish_reason":"stop","stop_reason":null}]} data:[DONE] 流式(stream参数为true,触发 内容审核 ) 状态码: 200 OK event:moderation data:{"suggestion":"block","reply":"作为AI语言模型,我的目标是以积极、正向和安全的方式提供帮助和信息,您的问题超出了我的回答范围。"} data:[DONE]
  • 响应参数 非流式 状态码: 200 表8 响应Body参数 参数 参数类型 描述 id String 用来标识每个响应的唯一字符串。形式为:"chatcmpl-{random_uuid()}" object String 固定为"chat.completion" created Integer 响应生成的时间,单位:s。 model String 请求模型ID,固定值:pangu。 choices Array of表9 ChatCompletionResponseChoice objects 生成的文本列表。 usage 表10 object 该对话请求的token用量信息。该参数可以帮助用户了解和控制模型的使用情况,避免超出Tokens限制。 prompt_logprobs Object 输入文本以及对应token的对数概率信息。 缺省值:null 表9 ChatCompletionResponseChoice 参数 参数类型 描述 message 表11 object 生成的文本内容。 index Integer 生成的文本在列表中的索引,从0开始。 finish_reason String 模型停止生成 token 的原因。 取值范围:[stop, length, content_filter, tool_calls, insufficient_system_resource] stop:模型自然停止生成,或遇到 stop 序列中列出的字符串。 length :输出长度达到了模型上下文长度限制,或达到了 max_tokens 的限制。 content_filter:输出内容因触发过滤策略而被过滤。 insufficient_system_resource:系统推理资源不足,生成被打断。 缺省值:stop logprobs Object 评估指标,表示推理输出的置信度。 缺省值:null stop_reason Union[Integer, String] 导致生成停止的token id或者字符串。如果是遇到EOS token则返回默认值。如果是因为用户请求参数参数中指定的stop参数中的字符串或者token id,则返回对应的字符串或者token id。不是openai接口标准字段,但vllm接口支持。 缺省值:None 表10 UsageInfo 参数 参数类型 描述 prompt_tokens Number 用户prompt中所包含的token数。 total_tokens Number 该次对话请求中,所有token的数量。 completion_tokens Number 推理模型所产生的答案的token数量。 表11 ChatMessage 参数 参数类型 描述 role String 生成这条消息的角色。固定为:assistant。 content String 对话的内容。 最小长度:1 最大长度:不同模型支持的token长度。 reasoning_content String 内容为在最终答案之前的推理内容(模型的思考过程)。 说明: 仅适用于 DeepSeek-R1 模型。 流式(stream参数为true) 状态码: 200 表12 流式输出的数据单元 参数 参数类型 描述 data CompletionStreamResponse object stream=true时,模型生成的消息以流式形式返回。生成的内容以增量的方式逐步发送回来,每个data字段均包含一部分生成的内容,直到所有data返回,响应结束。 表13 CompletionStreamResponse 参数 参数类型 描述 id String 该对话的唯一标识符。 created Integer 创建聊天完成时的 Unix 时间戳(以秒为单位)。流式响应的每个 chunk 的时间戳相同。 model String 生成该 completion 的模型名。 object String 对象的类型, 其值为 chat.completion.chunk。 choices ChatCompletionResponseStreamChoice 模型生成的 completion 的选择列表。 表14 ChatCompletionResponseStreamChoice 参数 参数类型 描述 index Integer 该 completion 在模型生成的 completion 的选择列表中的索引。 finish_reason String 模型停止生成 token 的原因。 取值范围:[stop, length, content_filter, tool_calls, insufficient_system_resource]。 stop:模型自然停止生成,或遇到 stop 序列中列出的字符串。 length :输出长度达到了模型上下文长度限制,或达到了 max_tokens 的限制。 content_filter:输出内容因触发过滤策略而被过滤。 insufficient_system_resource:系统推理资源不足,生成被打断。 状态码: 400 表15 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。
  • 请求参数 使用Token认证方式的请求Header参数见表3。 V1接口支持Token鉴权方式,也支持API Key鉴权方式。 表3 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表 请求Header参数(API Key认证)。 表4 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 V2接口只支持API Key鉴权方式。 表5 V2接口请求Header参数(OpenAI格式的API Key认证) 参数 是否必选 参数类型 描述 Authorization 是 String 用户创建应用接入获取的API Key,拼接“Bearer ”后的字符串。示例:Bearer d59******9C3。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表6 请求Body参数 参数 是否必选 参数类型 描述 messages 是 Array of 表7 objects 多轮对话问答对,包含两个属性:role和content。 role表示对话的角色,取值是system或user。 如果需要模型以某个人设形象回答问题,可以将role参数设置为system。不使用人设时,可设置为user。在一次会话请求中,人设只需要设置一次。 content表示对话的内容,可以是任意文本。 messages参数可以帮助模型根据对话的上下文生成合适的回复。 model 是 String 使用的模型ID,根据所部署的模型填写,填写DeepSeek-R1或DeepSeek-V3。 stream 否 boolean 流式开关。流式输出协议为SSE(Server-Sent Events)协议。 如果开启流式,请赋值true。开启流式开关后,API会在生成文本的过程中,实时地将生成的文本发送给客户端,而不是等到生成完成后一次性将所有文本发送给客户端。 缺省值:false temperature 否 Float 用于控制生成文本的多样性和创造力。 控制采样随机性的浮点数。一般来说,temperature越低,适合完成确定性的任务。temperature越高,如0.9,适合完成创造性的任务。值为 0 意味着贪婪采样。当取值超过1,会大概率出现效果不可用问题。 temperature参数可以影响语言模型输出的质量和多样性,但也不是唯一的因素。还有其他一些参数,如top_p参数也可以用来调整语言模型的行为和偏好,但不建议同时更改这两temperature和top_p。 最小值:0,建议不要低于1e-5 最大值:1.0 缺省值:1.0 top_p 否 Float 核采样参数。作为调节采样温度的替代方案,模型会考虑前 top_p 概率的 token 的结果。0.1 就意味着只有包括在最高 10% 概率中的 token 会被考虑。 建议修改这个值或者更改 temperature,但不建议同时对两者进行修改。 取值范围:(0.0, 1.0] 缺省值:0.8 max_tokens 否 Integer 生成文本的最大输出token数量。 输入的文本加上生成的文本总量不能超过模型所能处理的最大长度。 最小值:1 最大值:8K token。 缺省值:默认部署时,token长度为最大值。 说明: token是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token,然后根据模型的概率分布进行采样或者计算。 presence_penalty 否 Float 用于调整模型对新Token的处理方式。即如果一个Token已经在之前的文本中出现过,那么模型在生成这个Token时会受到一定的惩罚。当presence_penalty的值为正数时,模型会更倾向于生成新的、未出现过的Token,即模型会更倾向于谈论新的话题。 最小值:-2 最大值:2 缺省值:0 (表示该参数未生效)。 frequency_penalty 否 Float 用于调整模型对频繁出现的Token的处理方式。即如果一个Token在训练集中出现的频率较高,那么模型在生成这个Token时会受到一定的惩罚。当frequency_penalty的值为正数时,模型会更倾向于生成出现频率较低的Token,即模型会更倾向于使用不常见的词汇。最小值:-2,最大值:2 最小值:-2 最大值:2 缺省值:0 (表示该参数未生效)。 表7 ChatCompletionMessageParam 参数 是否必选 参数类型 描述 role 是 String 对话的角色,默认取值范围:system、user、assistant、tool、function。支持自定义。 如果需要模型以某个人设形象回答问题,可以将role参数设置为system。不使用人设时,可设置为user。 返回参数时,为固定值:assistant。 在一次会话请求中,人设只需要设置一次。 content 是 String 对话的内容,可以是任意文本,单位token。 设置多轮对话时,message中content个数不能超过20。 最小长度:1 最大长度:不同模型支持的token长度。 缺省值:None
  • URI NLP推理服务支持使用盘古推理接口(V1推理接口)调用,也支持使用业界通用的OpenAi格式接口(V2推理接口)调用。 V1接口、V2接口的鉴权方式不同,请求体和返回体略有差异。 表1 NLP服务推理接口 API分类 API访问路径(URI) V1推理接口 POST /v1/{project_id}/deployments/{deployment_id}/chat/completions V2推理接口 POST /api/v2/chat/completions 表2 V1推理接口路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部署ID,获取方法请参见获取模型部署ID。
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 stream 是 Boolean 是否开启流式调用,默认开启。 true:开启 false:不开启 说明: 当前Agent只支持流式调用,需设置为true。 表3 请求Body参数 参数 是否必选 参数类型 描述 query 是 String 用户问题,作为运行Agent的输入。
  • 响应参数 流式(Header中的stream参数为true) 状态码: 200 表4 流式输出的数据单元 参数 参数类型 描述 data String stream=true时,执行Agent的消息以流式形式返回。 生成的内容以增量的方式逐步发送回来,每个data字段均包含一部分生成的内容,直到所有data返回,响应结束。 表5 流式输出的数据单元 参数 参数类型 描述 event String 数据单元类型,有以下几种类型: start,开始节点,表示开始调用模型进行会话。 message,消息节点,表示模型返回的消息。 plugin_start,插件调用请求节点,表示调用插件的请求信息。 plugin_end,插件调用响应节点,表示调用插件的响应信息。 statistic_data,执行数据节点,包含本次调用的耗时信息。 summary_response,消息总结节点,包含本次调用的全量响应信息。 done,流式调用结束节点,表示流式响应结束。 content Object 消息块内容,不同event的消息块内容不同。 createdTime long 消息块返回的时间戳,如1733817348963。 latency Object 耗时,包括以下三个元素: plugin,插件调用耗时 model,模型调用耗时 overall,总耗时 plugin Object 插件请求信息,包括以下两个元素: name,插件名 arguments,插件入参名
  • 请求示例 流式(Header中的stream参数为true) POST https://{endpoint}/v1/{project_id}/agent-run/agents/{agent_id}/conversations/{conversation_id} Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... stream: true Request Body: { "query": "查询A12会议室在9:00到10:00的状态" }
  • 响应示例 data:{"event":"start","createdTime":1735558575017} data:{"event":"message","content":"好的","createdTime":1735558576300} data:{"event":"message","content":",","createdTime":1735558576301} data:{"event":"message","content":"我将","createdTime":1735558576301} data:{"event":"message","content":"调用","createdTime":1735558576302} data:{"event":"message","content":"query","createdTime":1735558576302} data:{"event":"message","content":"_","createdTime":1735558576302} data:{"event":"message","content":"meeting","createdTime":1735558576302} data:{"event":"message","content":"_","createdTime":1735558576302} data:{"event":"message","content":"room","createdTime":1735558576303} data:{"event":"message","content":"_status","createdTime":1735558576303} data:{"event":"message","content":"工具","createdTime":1735558576303} data:{"event":"message","content":"来","createdTime":1735558576304} data:{"event":"message","content":"查询","createdTime":1735558576304} data:{"event":"message","content":"A","createdTime":1735558576304} data:{"event":"message","content":"12","createdTime":1735558576304} data:{"event":"message","content":"会议室","createdTime":1735558576305} data:{"event":"message","content":"在","createdTime":1735558576305} data:{"event":"message","content":"9","createdTime":1735558576305} data:{"event":"message","content":":00","createdTime":1735558576305} data:{"event":"message","content":"到","createdTime":1735558576306} data:{"event":"message","content":"10","createdTime":1735558576306} data:{"event":"message","content":":00","createdTime":1735558576306} data:{"event":"message","content":"的状态","createdTime":1735558576306} data:{"event":"message","content":"。","createdTime":1735558576306} data:{"event":"message","content":"请","createdTime":1735558576307} data:{"event":"message","content":"稍","createdTime":1735558576307} data:{"event":"message","content":"等","createdTime":1735558576307} data:{"event":"message","content":"。","createdTime":1735558576307} data:{"event":"message","content":" ","createdTime":1735558576307} data:{"event":"message","content":" query","createdTime":1735558576307} data:{"event":"message","content":"_","createdTime":1735558576308} data:{"event":"message","content":"meeting","createdTime":1735558576308} data:{"event":"message","content":"_","createdTime":1735558576308} data:{"event":"message","content":"room","createdTime":1735558576308} data:{"event":"message","content":"_status","createdTime":1735558576308} data:{"event":"message","content":"|","createdTime":1735558576308} data:{"event":"message","content":"{\"","createdTime":1735558576309} data:{"event":"message","content":"meeting","createdTime":1735558576309} data:{"event":"message","content":"Room","createdTime":1735558576309} data:{"event":"message","content":"\":","createdTime":1735558576309} data:{"event":"message","content":"{\"","createdTime":1735558576309} data:{"event":"message","content":"number","createdTime":1735558576310} data:{"event":"message","content":"\":","createdTime":1735558576310} data:{"event":"message","content":" 12","createdTime":1735558576310} data:{"event":"message","content":"}","createdTime":1735558576310} data:{"event":"message","content":",\"","createdTime":1735558576310} data:{"event":"message","content":"start","createdTime":1735558576310} data:{"event":"message","content":"\":\"","createdTime":1735558576311} data:{"event":"message","content":"9","createdTime":1735558576311} data:{"event":"message","content":":00","createdTime":1735558576311} data:{"event":"message","content":"\",\"","createdTime":1735558576311} data:{"event":"message","content":"end","createdTime":1735558576311} data:{"event":"message","content":"\":\"","createdTime":1735558576311} data:{"event":"message","content":"10","createdTime":1735558576311} data:{"event":"message","content":":00","createdTime":1735558576312} data:{"event":"message","content":"\"}","createdTime":1735558576312} data:{"event":"message","content":" ","createdTime":1735558576312} data:{"event":"plugin_start","type":"plugin","latency":{"overall":1.3},"plugin":{"name":"query_meeting_room_status","arguments":"{\"meetingRoom\": {\"number\": 12}, \"start\": \"9:00\", \"end\": \"10:00\"}"},"createdTime":1735558576316} data:{"event":"plugin_end","content":{"result":"空闲"},"role":"function","latency":{"overall":1.51,"plugin":0.0},"createdTime":1735558576521} data:{"event":"start","createdTime":1735558576522} data:{"event":"message","content":"A","createdTime":1735558576976} data:{"event":"message","content":"12","createdTime":1735558576977} data:{"event":"message","content":"会议室","createdTime":1735558576977} data:{"event":"message","content":"在","createdTime":1735558576977} data:{"event":"message","content":"9","createdTime":1735558576978} data:{"event":"message","content":":00","createdTime":1735558576978} data:{"event":"message","content":"到","createdTime":1735558576978} data:{"event":"message","content":"10","createdTime":1735558576978} data:{"event":"message","content":":00","createdTime":1735558576978} data:{"event":"message","content":"的时间","createdTime":1735558576978} data:{"event":"message","content":"段","createdTime":1735558576979} data:{"event":"message","content":"内","createdTime":1735558576979} data:{"event":"message","content":"是","createdTime":1735558576979} data:{"event":"message","content":"空闲","createdTime":1735558576979} data:{"event":"message","content":"的","createdTime":1735558576979} data:{"event":"message","content":"。","createdTime":1735558576980} data:{"event":"statistic_data","latency":{"overall":1.97},"createdTime":1735558576986} data:{"event":"summary_response","content":"A12会议室在9:00到10:00的时间段内是空闲的。","role":"assistant","createdTime":1735558576987} data:{"event":"done","createdTime":1735558577011}
  • 请求示例 POST https://{endpoint}/v1/{project_id}/agent-run/workflows/{workflow_id}/conversations/{conversation_id} Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... stream: true Request Body: { "inputs": { "query": "你好" }, "plugin_configs": [ { "plugin_id": "xxxxxxxxx", "config": { "key": "value" } } ] }
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全