云服务器内容精选

  • 响应示例 { "sub_queries": [ "今天天气怎样?" ], "category": "天气类", "calculation": false, "timeliness": true, "language": "zh", "output_language": "", "date_range": "2025-05-15~2025-05-15", "cost": 164.17336463928223 }
  • 请求参数 使用Token认证方式的请求Header参数见表1。 表1 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。 获取Token 接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表 请求Header参数(API Key认证)。 表2 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表3 请求Body参数 参数 是否必选 参数类型 描述 query 是 String 参数解释: query信息。 约束限制: 字符串长度限制:1~1024 取值范围: 不涉及 默认取值: 不涉及 history 否 List[String] 参数解释: 多轮对话的query和answer。实现逻辑如下: 只参考最近5轮对话。 对话历史和问题总长度1000token,超长会按照特定逻辑截断。 问题只参考前500字。 约束限制: 元素必须为偶数个,如 [Question1, Answer1, Question2, Answer2] 按照对话顺序从旧到新。 问题 Question 必填。 答案 Answer 可以为空字符串,但必须占位。 取值范围: 数组长度限制:0~50 字符串长度限制:0~4096 默认取值: 不涉及
  • 响应参数 状态码:200 表4 响应Body参数 参数 参数类型 描述 category String Query分类,对于行业知识类,建议使用前缀匹配。 闲聊类:坐火车累死了 语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。 人设类:你叫什么名字 通用知识类:豆汁和豆浆的区别 天气类:明天北京天气 行业知识类: 行业知识类-金融:贷款重组的定义是什么? 行业知识类-政务:《国务院关于印发新一代人工智能发展规划的通知》的指导思想是什么? 行业知识类-制造: 行业知识类-医疗:儿童便秘市面上常见西药是什么?对于未考虑到行业知识类的细分类别,一般会分为"行业知识类" sub_queries List[String] 多轮改写和复杂问题分解之后的子查询问题,可能包含多个值。 language String 查询语言,编码对应 ISO 639-1。 zh:中文 en:英文 ar:阿语 fr:法语 th:泰语 mix:混合 unknown:未知 timeliness boolean 时效性查询,比如今天天气怎么样 date_range String 从query中抽取时间范围,抽取结果如: query: 2022年全网最高用电负荷最大时,外电入鲁电力是多少? date_range : 2022-01-01~2022-12-31 query: 华为一季度收入 date_range : 2024-01-01~2024-03-31 query: 今日时间 date_range: 2024-04-01 query: 2023年11月30日配套储能放电量是多少? date_range: 2023-11-30~2023-11-30 query: 两天前北京发生了什么大事 date_range: 2024-03-30~2024-03-30 当有多个子query时,用";"拼接如: query: 2023年第一季度山东和山西的GDP date_range: 2023-01-01~2023-03-31;2023-01-01~2023-03-31 calculation boolean 计算类查询,比如经济增长率。 output_language String query是否涉及“请用xx语言回答”这样的表述,即会输出对应语言编码。如zh、en、ar、fr、th。无结果则输出""。 查询语言,编码对应 ISO 639-1。 cost float 请求处理耗时,单位ms。 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误信息
  • 向量&重排专业大模型 模型介绍 Pangu-EmbeddingRank模型,用于大模型RAG场景。在ModelArts Studio大模型开发平台部署Pangu-EmbeddingRank模型,会生成Embedding模型服务、Rerank模型服务两个服务。这两个服务均可以在Agent开发平台中创建知识库中被使用。 推理特性 推理精度 FP16 起推规格(推理单元) 1 QPS 6 Embedding模型服务 Rerank模型服务 父主题: 模型推理接口