[快速入门]ai大模型架构
大模型混合云

了解详情 湘钢人工智能模型价值评估报告 了解详情 模型混合云十创新技术 了解详情 矿山产业集群模型运营最佳实践 了解详情 矿山大模型最佳实践白皮书 了解详情 政企AI平台架构及应用实践 湘钢人工智能模型价值评估报告 模型混合云十创新技术 了解详情 矿山产业集群模型运营最佳实践

盘古NLP大模型

盘古模型 盘古模型 盘古NLP模型 盘古NLP模型 优秀的模型结构,完善的工程化能力,最贴合行业落地的NLP模型 超大参数规模,最贴合行业落地的NLP模型 重磅发布盘古NLP 718B深度思考模型,多专家+稀疏比的MOE新架构,昇腾亲和设计,高效训推 专家咨询 ModelArts

盘古大模型 panguLM

行业大模型 行业大模型 行业大模型 行业大模型 面向B端提供5个基础模型,包括LLM模型、多模态模型、视觉模型、预测模型、气象模型等 面向B端提供5个基础模型,包括LLM模型、多模态模型、视觉模型、预测模型、气象模型等 专家咨询 文档 五基础模型 夯实行业大模型能力

盘古预测大模型

盘古模型 盘古模型 盘古预测模型 盘古预测模型 通过历史数据学习得到的面向结构化任务场景,针对事物发展趋势、状态类别等进行量化预测的预训练模型 通过历史数据学习得到的面向结构化任务场景,针对事物发展趋势、状态类别等进行量化预测 重磅发布盘古统一编码预测模型 跨模态知识融合

盘古科学计算大模型

定区域模型 速度快 气象模型单卡可推,分钟级预报,提速百倍 多种部署形态 支持公有云、混合云、边缘多种形态,满足不同需求 文档与学习成长 盘古模型 盘古模型 什么是盘古模型 盘古科学计算模型能力与规格 盘古模型用户指南 如何调用盘古模型API 查看全部 AI Gallery百模千态社区

盘古多模态大模型

广汽借助华为云盘古多模态模型,打造业界首个支持点云生成的模型,为其端到端仿真高效迭代提供强有力支撑。 文档与学习成长 盘古模型 盘古模型 什么是盘古模型 盘古多模态模型能力与规格 用户指南 如何调用盘古模型API 查看全部 AI Gallery百模千态社区 AI Gallery百模千态社区

大模型混合云十大场景

模型混合云TOP N 场景 模型混合云TOP N 场景 1对1咨询 了解华为云Stack 模型行业场景落地三要素 模型行业场景落地三要素 场景是模型行业落地的关键所在,而在场景落地过程中,数据、经验和生态是核心要素,数据的数量和质量决定模型效果上限;经验就像“名师指导”

ModelArts Studio大模型开发平台

盘古模型 盘古模型 模型开发平台ModelArts Studio 模型开发平台ModelArts Studio 支持百模千态的模型工具链平台,构建规模化可复制的行业大模型解决方案,深入行业解决行业难题 支持百模千态的模型工具链平台,构建规模化可复制的行业大模型解决方案,深入行业解决行业难题

大模型安全护栏 ModelArts Guard

模型安全护栏 ModelArts Guard 模型安全护栏 ModelArts Guard 模型安全护栏(ModelArts Guard),做配套模型的内容安全防线 模型安全护栏(ModelArts Guard),做配套模型的安全防线,开放兼容,适用盘古模型和三方模型

[相关产品]ai大模型架构
AI大模型 算法备案

《互联网信息服务算法推荐管理规定》明确,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息  方便

AI大模型专业服务

湘江鲲鹏目前在人工智能模型领域拥有算力、数据、算法三关键要素的经验积累,构建了模型三个方面的差异化竞争力,盘古模型AI专业服务覆盖从前期咨询、规划设计,到数据工程、模型训练,再到应用工程及模型运维的完整流程。基于华为盘古提供的AI专业服务包,致力于为企业提供一站式人工智能解决方案

大模型及AI应用配套服务

段,使模型在具体应用任务上收敛;制造领域结构化知识库,提升模型生成内容质量。5. 具备扎实的Python语言编程能力基础,可熟练使用LangChain等流行的模型开发框架,构建企业级AI应用;团队拥有成熟的软件工程技术和管理能力。6. 模型使用的技术支持,用户使用模型平台

天尊大模型AIGC场景解决方案

太杉天尊模型AIGC场景解决方案是以AI场景解决方案为核心的全栈Maas综合方案,助力政企客户灵活部署(可公有可私有部署)。具备自研的行业模型能力,主要用于政府/公安/教育等行业的数据处理、文本处理以及多模态处理等多场景。太杉天尊模型AIGC场景解决方案,是一款专为满足政府企

人工智能AI大模型技术研发定制服务

公司集成了世界领先的底层模型,具备打通跨模型和工具链的平台,提供从需求分析、数据收集、模型设计、训练优化、评估、系统集成、用户界面设计、部署维护、合规性检查、技术支持、性能监控、扩展性设计、定制服务到持续研发一站式AI模型定制研发服务。光启慧语是一家围绕模型全栈开展技术研发和产

博匠行业AI大模型专业服务

数据质量。4. 模型训练:设计调优方案,实施模型训练,并进行模型评测。熟悉盘古模型工作流和云服务操作,确保模型效果优化。5. 应用工程:提供基于模型能力的Agent开发和应用对接服务。具备良好的软件开发和沟通能力,实现模型与应用的无缝对接。6. 模型运维: 提供技

盘古大模型专家服务

. 模型更新后,将新模型部署至相应环境。 十一、模型评测1. 设计模型评测方案,对模型各类指标进行评测。2. 能够按评测标准对模型各项能力进行打分,输出模型评测报告。 十二、Agent开发1. 基于场景,设计并开发Agent工具。2. 基于langchain等模型框架,完

天尊大模型AIGC场景解决方案配套服务

天尊模型AIGC场景解决方案配套服务是太杉AIGC解决方案的人工服务,是以AI应用解决方案为核心的全栈Maas综合方案,助力政企客户灵活部署(可公有可私有部署)。主要用于政府/公安/教育等行业的数据处理、文本处理以及多模态处理等多场景。天尊模型AIGC场景解决方案配套服务是太

序列猴子大模型

出门问问模型“序列猴子”是一款具备多模态生成能力的语言模型模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语言生成和语音识别等不同任务。出门问问模型“序列猴子”是一款具备多模态生成能力的语言模型,模

[相似文章]ai大模型架构
ModelArts推理部署_模型_AI应用来源-华为云

本地准备模型包 ModelArts支持本地准备模型包,编写模型配置文件和模型推理代码,将准备好的模型包上传至对象存储服务OBS,从OBS导入模型创建为AI应用。 制作模型包,则需要符合一定的模型包规范。模型包里面必须包含“model”文件夹,“model”文件夹下面放置模型文件,模型配置文件,模型推理代码文件。

ModelArts模型训练_模型训练简介_如何训练模型

ModelArts模型训练 ModelArts模型训练简介 ModelArts模型训练,俗称“建模”,指通过分析手段、方法和技巧对准备好的数据进行探索分析,从中发现因果关系、内部联系和业务规律,为商业目的提供决策参考。训练模型的结果通常是一个或多个机器学习或深度学习模型模型可以应用到新的数据中,得到预测、评价等结果。

GaussDB数据库模型_GaussDB是什么_高斯数据库模型

端口。 高斯数据库模型-应用场景 金融核心交易 ERP/CRM 政企OA/办公 金融核心交易 金融核心交易 适用于各类银行核心交易系统分布式改造,数据库的原生分布式能力可以极大的降低改造和迁移工作量。两地三中心等极致高可用能力,可以为核心业务保驾护航。 优势 容量高扩展:支持T

GaussDB架构_GaussDB数据库架构_高斯数据库架构-华为云

从而实现数据全生命周期内的安全保护。 AI-Native自治,管理智能高效 AI-Native自治,管理智能高效 参数自调优 当前已经覆盖了500+重点参数,通过深度强化学习与全局调优算法,结合不同业务负载模型进行针对性调优,相比DBA人工根据经验调优,性能提升30%的同时,耗费时间从天下降到分钟级。

免费AI客服电话_AI智能语音外呼系统_AI人工语音智能电话

000.00元/年 免费AI客服电话-智能AI客户联络中心-AI智能电话机器特征 免费AI客服电话-智能AI客户联络中心-AI智能电话机器特征 免费AI客服电话-内置ASR引擎 支持ASR,NLP,NLU,TTS等技术数据整合识别、响应飞速提升 免费AI客服电话-多轮会话 领先的

.email域名注册_如何注册.email域名

.email域名注册 什么是.email域名注册? 域名注册(Domain Registration)是用户付费获取Internet上某一域名一段时间使用权的过程。华为云域名注册服务提供域名的注册、购买、实名认证以及管理功能。 华为云的域名注册服务与新网合作,因此通过华为云注册的

网站安全-Web应用防火墙-功能场景

Web应用防火墙新功能-模型防火墙 模型防火墙保障模型应用安全合规 模型防火墙保障模型应用安全合规 生成式人工智能技术的迅猛发展推动了模型AI推理领域的规模化应用,由此也暴露出新型安全隐患:推理过程中对用户输入的敏感信息缺乏有效过滤、攻击者通过精心设计的提示词注入诱导模型输出违规指

数据治理中心_数据架构_数据架构使用示例-华为云

按照业务需求新增码表及数据标准 标准设计 模型设计-关系建模 基于关系建模的逻辑模型和物理模型,新建SDI层和DWI层两个模型。 基于关系建模的逻辑模型和物理模型,新建SDI层和DWI层两个模型模型设计-关系建模 模型设计-维度建模 基于维度建模,新建DWR层模型并发布维度和事实表;新建DM层并发布汇总表。

GaussDB架构_GaussDB分布式形态_高斯数据库架构-华为云

数据库存储与访问、数据加载、迁移等 GaussDB应用构建 推荐 华为云数据库专家现场Demo演示 更多精彩直播 与咖专家零距离>>> 推荐文章 GaussDB给世界一个更优选择 新品 产品动态 GaussDB的六关键技术特性 推荐 技术解读 案例 || 为什么选择GaussDB 热门 客户案例 中国首

ai大模型架构

服务概述

AI平台 场景化建模方案规划服务运用华为AI技术和模型构建经验,为客户提供AI平台场景化建模方案规划专业服务,结合客户的业务场景和算法开发能力,为客户提供场景化建模咨询、分析和设计服务。AI平台架构规划服务主要面向千行百业中有行业实际场景需求,并希望通过大模型去解决这些需求的客户。华为云将基于自研AI平台,结合客户业务场景,提供专业的架构规划设计服务,帮助用户解决架构设计困难,通用框架资源利用率低,大规模集群下网络拥塞等关键痛点。

服务内容

AI平台咨询与规划服务

服务规格

SKU编码

服务内容

适用场景

AI平台场景化建模分析服务-基础版

modelarts.service.aipma.basic

对客户场景需求、基础设施情况和业务环境进行调研分析,提供基础的分析报告。

面向简单业务需求场景,提供基础业务场景和基础设施的调研分析服务。

AI平台场景化建模分析服务-标准版

modelarts.service.aipma.standard

  1. 对客户场景需求进行调研分析,提供基础的分析报告,较为清晰地描述应用场景,满足客户业务需求。
  2. 对客户基础设施资源进行调研分析,提供基础的分析报告,包括算力、工具、平台等。
  3. 对客户业务环境进行调研分析,提供基础的分析报告,包括业务应用层、模型层、平台层、数据层等。

面向简单业务需求场景,提供较详细的场景需求、基础设施资源和业务环境的调研分析服务。

AI平台场景化建模分析服务-专业版

modelarts.service.aipma.professional

  1. 对客户场景需求进行调研分析,提供较完善的分析报告,较为清晰地描述应用场景,满足客户业务需求。
  2. 对客户基础设施资源进行调研分析,提供较完善的分析报告,能够开展系统性资源评估,包括数据、算力、工具、平台、云环境等,初步制定资源需求清单。
  3. 对客户业务环境进行调研分析,提供较完善的分析报告,包括业务应用层、模型层、平台层、数据层等,推荐常用模型,具备一定的业务风险识别能力。

面向较复杂的业务需求场景,提供较完善的场景需求、基础设施资源和业务环境的调研分析服务,并为客户推荐常用的模型,以及提供基础的可行性分析服务。

AI平台场景化建模分析服务-铂金版

modelarts.service.aipma.platinum

  1. 对客户场景需求进行调研分析,提供较完善的分析报告。
  2. 对客户基础设施资源进行调研分析,提供完善的分析报告,能够开展系统性资源评估,包括数据、算力、工具、平台、云环境等,初步制定资源需求清单。
  3. 对客户业务环境进行调研分析,提供完善的分析报告,包括业务应用层、模型层、平台层、数据层等。
    1. 具备完善的业务风险识别能力,包含业务分析、成熟度分析、数据架构、风险分析等。
    2. 整理推荐模型的能力矩阵,匹配业务需求与模型专长特点,提供专业的模型评估及选型服务。
  4. 针对客户业务需求,为客户规划训练/推理/应用高阶方案,并提供可行性分析,提供较完善的分析报告,包括技术可行性、经济效益、法规遵从性和实施时间表等,对模型性能指标和业务效果指标进行设定。

面向复杂的业务需求场景,提供完善的场景需求、基础设施资源和业务环境的调研分析服务,提供专业的模型评估及选型服务。

AI平台场景化建模设计服务-基础版

modelarts.service.aipmd.basic

提供基于 ModelArts 平台的模型训练(蒸馏、增训、微调三选一)方案设计、推理方案设计。

  1. 蒸馏:生成思维链数据。5000条以内数据规模。
  2. 增训:无思维链增训。
  3. 微调:2000条以内数据规模。

面向简单业务场景,提供蒸馏、增训、微调三选一模型训练和推理方案设计。

AI平台场景化建模设计服务-标准版

modelarts.service.aipmd.standard

提供基于ModelArts平台的模型训练(蒸馏、增训、微调三选一)方案设计、推理方案设计。

  1. 蒸馏:生成思维链数据 + 微调。5000条以内数据规模。
  2. 增训:增训 + 微调 + 强化学习,无思维链。
  3. 微调:5000条以内数据规模。

面向简单业务场景,提供蒸馏、增训、微调三选一模型训练和推理方案设计。

AI平台场景化建模设计服务-专业版

modelarts.service.aipmd.professional

提供基于ModelArts平台的模型训练(蒸馏、增训、微调三选一)方案设计、推理方案设计。

  1. 蒸馏:生成思维链数据 + 微调 + 强化学习。5000条以内数据规模。
  2. 增训:增训 + 微调 + 强化学习,含思维链。
  3. 微调:5000条以内数据规模 + 强化学习。

面向复杂业务场景,提供蒸馏、增训、微调三选一模型训练和推理方案设计。

AI平台场景化建模设计服务-铂金版

modelarts.service.aipmd.platinum

提供基于ModelArts平台的模型训练(蒸馏、增训、微调三选一)方案设计、推理方案设计,以及应用智能体设计。

  1. 蒸馏:生成思维链数据 + 微调 + 强化学习。5000条以内数据规模。
  2. 增训:增训 + 微调 + 强化学习,含思维链。
  3. 微调:5000条以内数据规模 + 强化学习。

面向复杂业务场景,提供蒸馏、增训、微调三选一模型训练和推理方案设计,以及应用智能体方案设计。

AI平台技术架构方案规划服务-资深顾问

modelarts.service.aipar.seniorcons

  1. Al平台架构方案分析

    需求调研:完成客户需求调研,了解客户业务需求和目标;输出分析报告:明确客户业务价值,输出AI平台架构规划的需求分析报告/可行性分析报告。

  2. 端到端训练系统的架构设计

    数据获取:获取客户的数据量级、模型大小、引擎框相以及项目设置和权限要求;输出设计方案:评估并筛选备选设计方案,完成训练系统的架构设计方案(包含数据架构、网络架构、存储架构、安全架构等)。

  3. 端到端推理系统的架构设计

    数据获取:获取客户目标服务类型(文本/语音/图片等)、服务规模、服务形态(端侧/云侧)以及业务监控和权限要求;输出设计方案:评估并筛选备选设计方案,完成推理系统的架构设计方案(包含数据架构、网络架构、存储架构、安全架构等)。

AI平台架构基础架构设计,包含数据架构、网络架构、存储架构、安全架构规划。按照服务专家水平做区分。

AI平台技术架构方案规划服务-高级咨询专家

modelarts.service.aipar.seniormanage

AI平台技术架构方案规划服务-资深咨询专家

modelarts.service.aipar.seniorprincipa

  1. AI平台场景化建模方案规划服务
    1. AI平台场景化建模分析服务
      1. 训推场景需求调研

        目的:通过系统化调研,精准识别场景中的需求痛点,确保训练与推理模型的设计、开发及部署能够贴合真实应用场景,提升技术落地的有效性和实用性。

        内容:

        服务项目

        服务内容说明

        需求分类

        调研对象:业务经理、业务工程师。

        明确客户的需求分类,如

        1. 训练场景:增量预训练、微调、蒸馏。
        2. 推理场景:基于MaaS、ModelArts Lite Server/Cluster、CloudPond形态进行模型部署。

        业务场景

        调研对象:业务经理、业务工程师。

        调研基于模型的应用业务场景、模型调用方式、模型依赖关系等:

        1. 明确客户的实际业务场景,梳理当前业务痛点(如客服响应慢、数据分析低效、内容生成需求等)。
        2. 数据获取方式:需要明确客户业务数据的获取方式以及与交互方式等。

        模型要求

        调研对象:项目负责人、算法工程师。

        了解当前已有大模型的现状及指定模型要求(可选):

        1. 性能要求:包含单token时延、并发量、端到端请求时延、应用日活等。
        2. 技术实现方式:包含模型选择、应用模式(深度思考、联网搜索)、部署形态、框架选择、算力成本等。

        AI框架

        调研对象:项目负责人、算法工程师。

        是否有指定AI框架的诉求:如

        1. 训练框架:MindSpeed-LLM等。
        2. 推理框架:如MindIE、vLLM等。

        约束条件

        调研对象:项目负责人。

        该约束条件为客户指定的约束,如数据安全限制、性能与成本平衡、后续可扩展需求等。

      2. 基础设施调研

        目的:通过调研基础设施现状,识别底座硬件资源的潜在风险和需求,为后续评估大模型的可行性以及训推方案规划提供输入。

        内容:

        服务项目

        服务内容说明

        模型平台

        明确当前是否已在业务场景中应用大模型、是否已搭建大模型的算力平台或者已购买使用云厂商的大模型开发平台,如华为云、阿里云等。

        算力资源

        1. 了解当前的算力资源,如
          1. 硬件配置:GPU型号、显存容量、单卡算力、集群规模及拓扑。
          2. 并行能力:是否支持多卡/多机分布式训练,是否存在显存或带宽瓶颈,是否满足大模型训练或者推理的最低算力资源要求。
        2. 是否有期望的产品形态要求:如MaaS、ModelArts Lite Cluster、ModelArts Lite Server、CloudPond。

        网络安全架构

        了解当前的网络架构,如

        1. 带宽与时延:节点间互联带宽、网络拓扑、是否支持低时延通信等。
        2. 稳定性:网络容错机制、故障恢复时间、是否满足大模型训练长周期稳定性需求等。
        3. 组网规模:当前网络规模大小、是否支持扩展等。

        存储系统

        1. 当前存储系统结构,如
          1. 数据吞吐:存储容量、IOPS(每秒读写次数)、带宽、是否满足海量训练资源数据加载需求。
          2. 数据治理 :数据预处理、标注质量、 数据管理 能力。
          3. 分布式存储:是否采用高性能分布式文件系统以及是否支撑多节点并发访问等。
        2. 是否有期望的存储方式,如 OBS SFS turbo。
      3. 场景分析与模型评估选型

        目的:基于业务场景需求调研和基础设施调研的结果以及详细分析,结合软硬件资源和大模型的能力矩阵等,提供专业的模型选型服务,优化资源利用效率,降低成本,提高模型应用性价比。

        内容:

        服务项目

        服务内容说明

        需求分析

        针对需求调研的结果,对实际业务场景需求进行拆解&分析,识别出有效需求。

        大模型能力矩阵对齐

        对照大模型能力矩阵(如知识问答、代码生成、文档处理等),结合大量相关案例经验,分析业务需求匹配度,将业务需求与各个模型进行对齐,初步筛出部分备选模型。

        模型评估指标设计

        针对模型设计模型评估指标,如:

        1. 资源效率指标:计算资源消耗(内存占用峰值、单次推理耗时等)。
        2. 性能指标:端到端响应时延、单token时延等。

        模型能力测试

        1. 基于模型评估指标,结合基准测试集对模型的性能进行测试。
        2. 根据需求选择是否提供模型特定能力进行测试:
          1. 基础性能指标:准确率与召回率、F1值等。
          2. 特定任务能力测试:如多语言能力、代码生成质量等。

        可行性评估

        基于需求调研及模型能力测试,对当前模型选型的可行性进行评估,包含技术可行性、资源可行性、业务适配性等。

      4. 训推方案规划

        目的:基于昇腾云 AI开发平台 ,对大模型做训练或者推理场景的解决方案规划,以最优路径实现AI赋能实际业务场景。

        内容:

        服务项目

        服务内容说明

        算力底座资源规划

        结合业务场景、客户需求以及模型选型,规划基础设施底座各硬件资源的规格,如以哪种形态部署、使用什么型号的昇腾卡和多少数量的昇腾卡来进行训练/推理、规划存储架构和网络安全架构的方案等。

        平台服务规划

        明确AI应用相关的开发平台形态及AI开发框架,如确定训练框架使用MindSpeed-LLM,推理框架使用MindIE/vLLM;开发工具链,如Jupyter Notebook、GitLab代码仓库;容器与编排,如Kubernetes、Docker、 镜像 仓库等; 安全与合规 ,如 数据加密 、访问控制、合规审计工具等;监控与运维,如Prometheus、 日志分析 等。

        模型使能规划

        基于业务需求,从训练、推理和应用等角度为客户规划相应的高阶方案,确定模型赋能业务应用落地所需的资源、选型及实现路径等。

    2. AI平台场景化建模设计服务
      1. 模型训练方案设计
        1. 增训方案设计

          目的:通过前期方案设计,与客户深入沟通其具体场景分析增训方案的合理性和可行性,明确增训方案在实施过程中数据工程,模型训练以及模型评测的方案细节,指导增训服务的开展。

          内容:

          服务内容

          服务详细描述

          场景分析

          基于客户实际行业、行业数据量、客户实际场景需求分析,做模型增训的合理性和可行性,输出建议。

          数据方案设计

          基于场景分析的结果制定数据集方案,包括行业数据选型,数据来源,数据处理方式,数据评估标准,数据配比方案,数据管理方案,数据安全保障方案等。

          模型方案设计

          基于场景分析的结果制定模型训练方案,包括模型选型,增训工作流的设计(增量预训练、SFT、RL等阶段),分布式训练方案设计,训练超参的设计等。

          模型评测方案设计

          针对客户场景和训练后的模型制定模型评测方案,包括精度性能的指标的制定,行业标准制定、模型评估验证标准制定、业务效果验证标准制定等。

        2. 蒸馏方案设计

          目的:前期方案设计,与客户团队沟通了解数据特点、模型应用目标、以及性能精度指标要求等,明确后续数据工程、模型训练、模型评测的方案细节,制定高效的模型蒸馏策略。

          内容:

          服务内容

          服务详细描述

          场景分析

          深入分析客户的业务场景、数据状况(如数据规模、质量、分布)和现有模型基础(如模型架构、性能指标),明确蒸馏的核心目标和需求。确定模型的输入输出格式(如文本、图像、结构化数据)、运行环境(如云端、边缘设备)及性能要求(如时延、吞吐量、内存占用)。

          学生模型判定

          根据场景分析结果,从现有模型库中选择合适的学生模型,综合考虑模型架构、规模(参数量、层数)和性能(精度、效率)等因素。例如,对于资源受限的边缘设备,可选择轻量级架构;对于高精度要求的场景,则选择中等规模但性能优越的模型。

          蒸馏策略选择

          综合考虑数据状况、模型特点和业务需求,选择合适的蒸馏策略并制定具体计划。例如,对于数据丰富的场景,采用基于数据微调的策略(如SFT或LoRA),利用领域数据优化学生模型;对于任务复杂度高的场景,引入强化学习策略(GRPO),通过奖励机制提升模型表现。制定详细的蒸馏计划,包括数据准备、模型训练、评估和迭代优化等阶段,确保蒸馏过程高效可控,最终交付符合业务需求的高性能模型。

          评测方案设计

          设计从客户业务场景中抽取具有代表性的数据,包括各种类型的输入和预期输出,构建评测数据集;根据业务场景定义一些定制化的评测标准,如对于生成文本的流畅性、逻辑性、专业性等方面的评估标准。

        3. 微调方案设计

          目的:前期方案设计,与客户团队沟通了解数据特点、模型应用目标、以及性能精度指标要求等,明确后续数据工程、模型训练、模型评测的方案细节,制定高效的模型微调策略。

          内容:

          服务内容

          服务详细描述

          场景方案设计

          1. 微调训练路线:针对数据量适中,根据某个场景,需要提高下游领域任务指令遵从,可通过指令微调对齐模型输出与业务需求,则采用监督微调(SFT或LoRA)训练。
          2. 强化学习路线:针对客户已有微调的场景模型,需要引导模型更好地适应特定的任务,使模型能够不断优化回答策略,在实际应用中表现得更加智能和高效,则采用强化学习策略。

          数据方案设计

          1. 行业指令数据:收集与客户行业相关的指令数据,并设计指令数据如何分类和标注,明确指令的意图和对应的输出格式,为模型微调提供高质量的训练样本。
          2. 强化学习数据:设计强化学习数据收集策略,确定如何收集和构建能够有效反映人类偏好的数据集。

          模型方案设计

          1. 模型超参数配置:根据客户的需求和硬件资源情况,设计如何配置模型的超参数,如学习率、批量大小、训练轮数等。
          2. 奖励模型设计:针对强化学习,需要根据业务目标和用户需求,设计合理的奖励模型,引导模型向更好的方向优化。

          评测方案设计

          1. 构建评测数据:设计从客户业务场景中抽取具有代表性的数据,包括各种类型的输入和预期输出,构建评测数据集。
          2. 评测标准设计:根据业务场景定义一些定制化的评测标准,如对于生成文本的流畅性、逻辑性、专业性等方面的评估标准。
      2. 模型推理方案设计

        目的:通过前期方案设计,与客户深入沟通其具体场景分析推理方案的合理性和可行性,明确模型推理以及部署验证的方案细节。

        内容:

        服务项目

        服务内容说明

        模型推理部署方案设计

        资源配置方案、推理参数配置方案。

        模型推理验证方案设计

        推理功能测试方案、推理性能测试方案。

      3. 应用智能体方案设计

        目的:基于需求调研报告,对应用智能体方案进行设计,确保应用层能满足用户需求,同时为后续开发测试提供清晰指导。

        内容:

        服务项目

        服务内容说明

        组件规划

        规划实现业务目标需要使用哪些组件。

        模块设计

        “感官”模块设计,规划输入数据处理逻辑,捕捉环境与用户需求信息。

        “大脑”模块设计,规划记忆存储、任务规划流程及协同逻辑,实现决策分析。

        “动作”模块设计,规划任务执行与工具调用逻辑。

        数据流设计

        规划如何高效集成各模块和组件,规范数据格式,形成完整数据流,实现需求目标。

  2. AI平台架构规划服务
    1. 算力底座设计

      目的:有效支撑AI训练高峰期与推理负载波动,降低资源浪费和能耗成本。

      内容:

      服务项目

      服务内容说明

      算力底座设计

      结合客户数据量、模型规模与服务性能要求,设计适配的算力资源方案,包括芯片类型、服务器规格、资源调度策略与扩展性保障。

    2. AI平台训推架构设计

      目的:规划弹性可扩展的训推系统架构,提升资源利用率与训推效率。

      内容:

      服务项目

      服务内容说明

      AI平台训推架构设计

      围绕训练与推理全流程,设计AI平台的架构拓扑,涵盖数据流、算力调度、模型存储、日志管理等关键模块,确保整体架构高效、可靠、可持续扩展。

    3. 训推流程方案设计

      目的:设计统一训推服务平台,支持模型服务化、弹性部署与监控管理。

      内容:

      服务项目

      服务内容说明

      训推流程方案设计

      梳理训练与推理业务的全流程环节,制定各模块之间的交互协议、作业调度与监控方案,提升流程运行效率与容错能力。

    4. 昇腾云脑设计

      目的:保障AI平台合规、安全、高效运行,满足企业在数据安全与运维合规上的核心诉求。

      内容:

      服务项目

      服务内容说明

      昇腾云脑设计

      针对采用华为昇腾平台的客户,设计昇腾云脑集群架构,包括资源虚拟化、分布式调度、智能运维和断点续训能力,确保客户高效利用昇腾生态。

前提条件

  • 客户应提前至少10工作日申请该服务,以便华为云评估客户需求并协调AI专家。
  • 双方达成一致的服务目标,并完成合同签订。

服务范围

  1. 服务覆盖范围

    AI平台场景化建模方案规划服务主要面向千行百业中有行业实际场景需求,并希望通过AI相关技术去解决这些需求的客户。华为云侧将基于AI平台,结合客户业务场景,提供专业的场景化建模方案规划服务。能够帮助企业快速集成AI平台能力到业务应用,针对计算机视觉、机器学习、NLP、决策优化等场景;工业质检、声音质检、工艺优化、零售识别、智能调度等行业,提供场景化建模分析与设计。

    AI平台架构规划服务面向各行业中希望利用AI技术解决实际业务场景问题但自身AI基础设施和架构设计能力不足的客户,包含以下内容:

    1. 调研客户业务场景需求:深入了解客户的业务场景,明确AI技术的应用目标和需求。对客户现有的AI开发和应用基础设施进行全面评估,明确其技术能力和资源瓶颈。
    2. 推荐合适的AI平台架构:结合客户的具体业务需求和技术现状,推荐最适合的AI平台架构,包括硬件配置、软件框架和网络架构。
    3. 优化资源利用率:通过专业的架构设计,优化资源利用率,减少网络拥塞,提高大规模集群的运行效率。
    4. 制定详细的训推架构规划设计:基于调研和评估结果,为客户制定详细的AI平台训推架构规划,确保后续模型的高效性和可扩展性。
    5. 运维支持服务:协助客户接入昇腾云脑运维服务、配置和初始化,为训练任务提供各种监控报警,故障检测能力,确保运维平台能够快速稳定投入使用。
  2. 服务不覆盖范围

    华为AI工程师只负责本工作说明书所载明的服务,提供不在服务范围内的服务需要额外付费。不在服务范围内的服务包括但不限于如下所示内容:

    1. 应客户要求超出正常工作日和工作时间的相关工作(注:涉及加班工资和补助)。
    2. 外购件产品。
    3. 超出项目方案约定范围的客户业务相关的开发维护工作。
  3. 服务区域

    中国。

服务流程

  1. AI平台场景化建模方案规划服务
    1. AI平台场景化建模分析服务

      服务阶段

      服务说明

      训推场景需求调研服务

      对客户的训推场景、实际业务场景和模型技术实现等相关需求进行调研

      基础设施调研服务

      对客户现有基础设施(如算力资源、网络架构、存储架构等)进行调研

      场景分析与模型评估选型

      对大模型进行模型评估及选型,推荐符合客户业务场景的模型

      方案规划服务

      根据需求从基础设施层、框架层、模型层到应用层为客户规划场景解决方案

      验收

      《AI平台场景化建模方案规划服务-**项目规划方案》汇报通过,客户验证交付件中的内容事项,签字确认《AI平台咨询与规划服务验收报告》

      移交

      项目完成,相关交付件移交给客户

    2. AI平台场景化建模设计服务

      服务阶段

      服务说明

      模型训练方案设计

      根据需求进行场景化建模设计(模型训练:增训、微调、蒸馏)

      模型推理方案设计

      进行模型推理所需的资源配置设计、推理参数配置设计,以及功能性和推理的性能验证方案设计

      应用智能体方案设计

      根据需求进行应用智能体方案设计

      验收

      《AI平台场景化建模方案规划服务-建模方案设计报告》汇报通过,客户验证交付件中的内容事项,签字确认《AI平台咨询与规划服务验收报告》

      移交

      项目完成,相关交付件移交给客户

  2. AI平台架构规划服务流程

    服务阶段

    服务说明

    需求调研及评估

    明确开发、部署、调优服务的需求范围及评估可行性

    方案设计

    基于客户需求痛点,评估并筛选备选方案,完成基于Model Arts平台的技术方案

    服务验收

    客户验证交付件中的内容事项,签字确认《AI平台架构规划服务验收报告》

    项目移交

    项目完成,相关交付件移交给客户

服务交付件

服务名称

交付件

AI平台场景化建模分析服务-基础版

《AI平台场景化建模方案规划服务-**项目规划方案》

AI平台场景化建模分析服务-标准版

AI平台场景化建模分析服务-专业版

AI平台场景化建模分析服务-铂金版

AI平台场景化建模设计服务-基础版

《AI平台场景化建模方案规划服务-建模方案设计报告》

AI平台场景化建模设计服务-标准版

AI平台场景化建模设计服务-专业版

AI平台场景化建模设计服务-铂金版

AI平台技术架构方案规划服务-资深顾问

《AI平台架构规划服务-训推架构规划设计服务开发报告》

AI平台技术架构方案规划服务-高级咨询专家

AI平台技术架构方案规划服务-资深咨询专家

责任矩阵

  • 共同责任
    • 双方商定并确认具体的业务需求及目标。
    • 双方商定并确认项目管理计划。
    • 双方商定并确认方案内容并评审。
    • 完成合同签订。
  • 华为责任
    • 华为云需明确此次项目的负责人,因特殊情况导致华为人员变更,需要提前3个工作日知会客户,直至项目最终验收完成。
    • 华为云得到客户授权后,授权数据仅限用于专业服务中涉及的服务内容,不得超出限定范围。
    • 咨询前,按照客户所选服务项,制定指导计划和报价清单供客户审核确认。
    • 咨询期间,依确认后的计划为指定客户进行技术指导。
    • 咨询结束后,根据所选咨询服务项,出具交付件清单。
    • 接收用户的服务申请,协调ModelArts平台专家与客户商定详情。
  • 客户责任
    • 提供详细准确的需求和场景。
    • 提供项目实施的必须件,比如:训练数据等。
    • 审核并确认华为提供的指导计划和交付件。
    • 执行项目验收。

责任分工矩阵表

以下为职责描述案例,可酌情修改;

R=责任方/Responsibility

S=协助方/Support

备注:如果是华为提供技术支持的服务内容,实施动作责任方为客户。

序号

服务流程

工作内容

华为

客户

1

需求提出

业务场景讲解,明确需求

S

R

2

需求理解

需求理解与关键问题定义

R

S

3

需求确认

需求确认,验收项确认

S

R

4

方案设计

场景建模分析、设计

R

S

5

方案汇报

场景建模分析、设计方案汇报

R

R

6

方案确认

场景建模分析、设计方案确认

S

R

7

服务验收

客户验收技术方案

S

R

8

项目移交

交付件整理与交接

R

S

9

交付确认

确认交付件准确性和完整性,确认项目完成

S

R

验收标准

华为按各服务子项提交“服务交付件”章节所述标准交付件,客户在华为云官网Console点击确认验收,或线下签字盖章《AI平台咨询与规划服务验收报告》作为服务验收通过依据。

服务名称

交付件

验收报告

AI平台场景化建模分析服务-基础版

《AI平台场景化建模方案规划服务-**项目规划方案》

《AI平台咨询与规划服务验收报告》

AI平台场景化建模分析服务-标准版

AI平台场景化建模分析服务-专业版

AI平台场景化建模分析服务-铂金版

AI平台场景化建模设计服务-基础版

《AI平台场景化建模方案规划服务-建模方案设计报告》

AI平台场景化建模设计服务-标准版

AI平台场景化建模设计服务-专业版

AI平台场景化建模设计服务-铂金版

AI平台技术架构方案规划服务-资深顾问

《AI平台架构规划服务-训推架构规划设计服务开发报告》

AI平台技术架构方案规划服务-高级咨询专家

AI平台技术架构方案规划服务-资深咨询专家

ai大模型架构常见问题

更多常见问题 >>
  • 模型转换,即将开源框架的网络模型(如Caffe、TensorFlow等),通过ATC(Ascend Tensor Compiler)模型转换工具,将其转换成昇腾AI处理器支持的离线模型。

  • 本次Serverless应用中心上线文生图应用,用户无需下载源代码、了解各种安装部署知识、安装复杂的依赖,通过华为云Serverless应用中心即可一键创建AI文生图应用,体验 “0” 构建门槛、“0” 资源闲置并具备极致弹性的Serverless AI绘图能力。

  • 华为云Serverless技术极大的优化了AI应用开发过程,一键部署AI应用、提升开发团队工作效率。让AI团队可以更关注业务实现,而无需关注底层技术细节。

  • 在自然语言处理(NLP)领域中,使用语言模型预训练方法在多项NLP任务上都获得了不错的提升,广泛受到了各界的关注。本课程将简单介绍一下预训练的思想,几个代表性模型和它们之间的关系。

  • 知识图谱(KG)和大语言模型(LLM)都是知识的表示形式。KG是符号化的知识库,具备一定推理能力,且结果可解释性较好。但存在构建成本高、泛化能力不足、更新难等不足。

  • 近年来越来越多的行业采用AI技术提升效率、降低成本,然而AI落地的过程确并不容易,AI在具体与业务结合时常常依赖于业务数据的采集、处理、模型训练、调优、编排、部署和运维等很多环节。华为云ModelArts是全流程AI开发平台,包含了AI应用的开发、部署和分享交易,通过解决AI开发各个环节所遇到的核心问题,ModelArts有效解决了AI落地难的问题,将极大促进AI技术的普惠。本议题将分享ModelArts的主要关键技术和应用案例。