大模型开发基本概念 大模型相关概念 概念名 说明 大模型是什么 大模型是大规模预训练模型的简称,也称预训练模型或基础模型。所谓预训练模型,是指在一个原始任务上预先训练出一个初始模型,然后在下游任务中对该模型进行精调,以提高下游任务的准确性。大规模预训练模型则是指模型参数达到千亿、万亿级别的预训练模型
安全 责任共担 身份认证与访问控制 数据保护技术 审计
计费FAQ 包年/包月和按需计费模式有什么区别 包年/包月和按需计费模式哪个更划算 同一资源是否同时支持包年/包月和按需计费两种模式 包年/包月和按需计费模式是否支持互相切换 资源到期了如何续费
数据工程工具链作为盘古大模型服务的重要组成部分,具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据发布和管理等功能。 该工具链能够高效收集和处理各种格式的数据,满足不同训练和评测任务的需求。
表1 计费模式表 计费类别 计费项 计费模式 计费量纲 付费方式 计费周期 数据服务 数据智算服务 按需计费 智算单元 后付费,根据服务实际消耗量计费 按实际任务时长,时长精确到秒。
500 Internal Server Error 表明服务端能被请求访问到,但是不能理解用户的请求。 501 Not Implemented 服务器不支持请求的功能,无法完成请求。 502 Bad Gateway 充当网关或代理的服务器,从远端服务器接收到了一个无效的请求。
压缩Deepseek大模型 模型在部署前,通过模型压缩可以降低推理显存占用,节省推理资源提高推理性能。通过对三方大模型的压缩,可以减小模型的存储大小,降低功耗,并提高计算速度。 登录ModelArts Studio平台,在“我的空间”模块,单击进入所需空间。 图1 我的空间 在左侧导航栏中选择
管理盘古数据资产 数据资产介绍 数据资产是指在平台中被纳入管理、存储并可供使用的数据集。 数据资产包含以下两种形式: 用户自行发布的数据集。 用户可以通过“数据工程 > 数据发布 >发布任务 ”功能将数据集发布为数据资产。发布的数据集支持查看详细信息、编辑、删除以及发布至AI Gallery
产品优势 全面的大模型系列 盘古大模型服务支持三方大模型的推理与部署,目前已预置DeepSeek R1/V3模型,多种模态逐步融合。
身份认证与访问控制 用户可以通过调用REST网络的API来访问盘古大模型服务,有以下两种调用方式: Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。
管理盘古模型资产 模型资产介绍 用户在平台中可试用、已订购或训练后发布的模型,将被视为模型资产并存储在空间资产内,方便统一管理与操作。用户可以查看模型的所有历史版本及操作记录,从而追踪模型的演变过程。同时,平台支持一系列便捷操作,包括模型训练、压缩和部署,帮助用户简化模型开发及应用流程
在“关联服务”中,选择“全部服务”,或者在“指定服务”中选择已部署好的大模型服务,单击“确定”。 在“应用接入”列表的“API Key”操作列中可获取API Key值。 父主题: 如何调用REST API
按需计费模式:按需付费是后付费方式,可以随时开通/关闭对应资源,支持秒级计费,系统会根据云服务器的实际使用情况每小时出账单,并从账户余额里扣款。 父主题: 计费FAQ
灵活的MCP服务 MCP服务以通用的“标准语言”把工具、数据通过“MCP服务器”的方式供给(一次开发、无限连接),可以更高效、更便捷地实现AI智能体与成千上万的外部工具与数据的互通。
通过结合医学知识库、自然语言处理和智能交互技术,医疗问诊助手智能体能够为患者提供初步的健康咨询、症状分析和诊断建议,同时减轻医生的工作负担,提升医疗服务效率。 本教程将指导你如何在Agent开发平台上搭建一个医疗问诊助手,用于获取健康建议。
表1 插件信息配置说明 参数名称 参数说明 插件URL 插件服务的请求URL地址。 URL协议只支持HTTP和HTTPS。 系统会校验URL地址是否为标准的URL格式。 URL对应的IP默认不应为内网,否则会导致注册失败。 请求方式 插件服务的请求方式,POST或GET。
续费 包周期资源到期后,如果您想继续使用服务,需要在保留期内进行手动续费,否则不能再对已过保留期的服务进行续费操作,需重新购买对应的服务。了解更多关于续费的信息,请参见续费。 欠费 在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。
每个插件实质上是经过标准化封装的API工具集合,提供即插即用的模块化服务,拓宽工作流的能力边界,完成更复杂的任务。 插件类型包括预置插件和个人插件。 预置插件:平台预置了代码解释器插件,能够执行输入的代码,得到运行结果。支持开发者直接将插件添加到工作流或应用中,丰富其能力。
响应示例如下,例如,对话机器人服务部署的区域为“ap-southeast-1”,响应消息体中查找“name”为“ap-southeast-1”,其中projects下的“id”即为项目ID。
服务内部异常。 请联系服务技术支持协助解决。 PANGU.3254 The requested inference service does not exist. 资源不存在。 请检查调用API时projectId和deploymentId是否填写正确,推理服务状态是否可用。