向下扎根，向上生长，华为云AI的“根”力量-华为云

向下扎根，向上生长，华为云AI的“根”力量

炫科技 | 智能进化论

“道生一，一生二，二生三，三生万物”，老子在《道德经》中将道视为孕育万物的根本。同理，科技树的发展也离不开最底层的根技术。当前，AI处在加速行业落地的关键阶段，但仍然面临很多挑战，比如：各行业的AI应用门槛依然不低，AI与行业知识的结合有待提升，开发者开发、训练和部署模型的效率不高等。

在推动AI落地方面，华为云的战略布局非常清晰——基于“一切皆服务”战略，聚焦三大根技术。如果把华为云的AI布局比作一棵大树，预训练大模型、知识计算、AI求解器这三大根技术就是深埋在沃土中的根系。

在第三届华为云AI院长峰会上，华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士田奇分享了华为云AI布局的最新进展，并介绍全新的华为云盘古图网络大模型。从这些根技术的迭代，可以一窥华为云AI的发展脉络。

向下扎根：从L0到L2，完成从学术大模型到产业大模型的转变

目前，预训练大模型已经成为AI产业界的热点。通过一次预训练+下游任务微调的方式，大模型让AI模型开发实现了从“作坊式”向“工业化”的升级。近两年，国内外科技巨头纷纷加入“练大模型”的队伍，各家大模型的参数体量从千亿到万亿甚至更高。

“比拼模型体量的‘大跃进’不可取。”田奇认为，大模型应该直面产业落地的挑战，完成从学术大模型到产业大模型的转变。

华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士田奇

回顾华为云盘古大模型的发展历程，从2020年启动研发，2021年4月正式发布，到2022年聚焦行业应用落地，这一过程中，华为云盘古大模型自身不断迭代，其进化路径可以分为L0-L1-L2三大阶段。L0-L2不是替代关系，而是并存，上层在下层的基础上演化而来。这也让盘古大模型一步步从实验室走向千行百业，走向更细分的实际场景。

L0是指基础大模型。目前，华为云已推出五大水平领域的基础大模型，分别为：NLP（中文语言）大模型、CV（视觉）大模型、科学计算大模型、多模态大模型和最新推出的Graph（图网络）大模型。

其中，NLP（中文语言）大模型是NLP领域首个千亿参数的中文大模型，它具备强大的文本理解和生成能力，可以理解文字背后的含义，从文本中抽取关键信息。

CV（视觉）大模型首次兼顾了图像判别与生成能力，在ImageNet 1%、10%数据集上的小样本分类精度上，达到了业界最高水平，能够对各行业的图像进行识别和检测，可广泛应用在工业质检、物流管理等领域。

科学计算大模型主要解决各种科学问题，如气象预报、海浪预测、分子动力学预测、微分方程求解等，旨在用AI促进基础科学的发展。

多模态大模型具备图像和文本的跨模态理解、检索与生成能力，通过跨模态语义关联实现视觉-文本-语音多模态统一表示，采用一个大模型即可灵活支撑图-文-音全场景AI应用，可用于产品设计、艺术创作、语音播报、海报创作等领域。

Graph（图网络）大模型首创图网络融合技术，在工艺优化、时序预测、智能分析等场景有广泛应用，比如预测企业财务风险、制造企业优化工艺等等。

L1是指行业大模型。若想发挥盘古大模型的能力和优势，还需要让盘古大模型与行业相结合，华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。

比如，药物分子大模型可以辅助科研人员加速药物研发过程，将严谨复杂的分子化合物生成过程可视化以及智能化，高效的进行筛查“老药”加以新用以及“新药”研发。通过预先训练学习17亿个小分子的化学结构，药物分子大模型实现了一个大模型赋能药物发现全链条任务。

L2是指面向更加细分场景的推理模型。以在电力行业为例，华为云基于盘古电力大模型，针对无人机电力巡检细分场景，通过一次预训练+下游任务的微调，推出盘古电力巡检大模型，解决了无人机智能巡检系统（缺陷检测）中的小样本学习、主动学习、增量学习等问题，解决了海量数据标注工作量大和缺陷种类繁多的问题。

此外，在华为云AI生态中，通过开源开放，盘古大模型将借助开发者和合作伙伴的力量，比如将L1行业大模型开放给ISV伙伴等，将大模型的能力进一步下沉到场景，普惠给更多企业。

“未来我们就是两条线，一是从练大模型到练好大模型，二是从用大模型到用好大模型。”

作为盘古大模型的“总设计师”，田奇分享了其未来的发展路径。他表示，在练好大模型方面，涉及很多前沿技术创新，需要联合高校和科研院所，发挥产学研融合的力量。比如大模型架构的创新、解决大模型资源消耗大、缺乏逻辑等问题。在用好大模型方面，“大模型也不是万能的，不一定能解决所有的问题，一定要找到高价值的场景，找到更适合大模型发挥作用的地方。”

“现在大模型大部分架构是基于Transformer等，大模型到底应该是什么样的结构，数据驱动怎么样跟知识结合在一起来训练大模型，这些都是‘练好大模型’值得探讨的地方。”中国科学技术大学信息学院常委副院长李厚强表示。

向上生长：五大优势，解决行业个性化难题

有了强壮的根系，要想持续向上伸展枝叶，必须把大模型放在具体行业中，放在企业核心生产系统中检验。目前，虽然推出预训练大模型的科技企业很多，但在落地应用方面，「智能进化论」认为，华为云盘古是走得最快的大模型之一。

“盘古大模型今年的一个重要目标，就是落地行业创造更大价值，形成关键技术的一些壁垒，为煤矿、水利、电力、金融、农业等行业创造更大的产业价值。”田奇表示。目前，盘古大模型已经在工业、城市、能源、金融、气象等多行业落地，在电路巡检、制造业工艺优化、工业质检等一百多个场景业务中实际应用。

在探索大模型落地方面，各个科技企业的策略和路径各不相同，有的以技能来划分大模型，有的推出众多细分行业大模型。华为云盘古大模型走的是强化通用性、泛化性的路线。“对行业落地来讲，我们本质上不希望一个行业一个模型，更希望打造一些通用的模型。”田奇表示。

以新推出的图网络大模型为例，一个大模型可以适配工艺优化、时序预测、智能分析等多个场景，同时应用在金融、煤矿、制造等多个行业。

比如，在智能分析场景下，图网络大模型帮助广发证券将企业异常财务识别准确率提高到90%，相对于原来的小模型方法提升了20%，实现了行业领先。

在时序预测场景下，图网络大模型帮助中央空调系统进行可挥发气体浓度的预测，智能监测空气质量，同时也在帮助零售企业进行销量预测。

在工艺优化场景下，图网络大模型则可以帮助制造行业优化工艺、降本增效。

田奇介绍，经过两年的迭代，华为云盘古大模型已经形成了五大优势，包括：AI开发门槛低、泛化性能高、样本标注快、模型精度高、场景通用性强。在这些优势的加持下，越来越多企业、机构正在将盘古大模型应用到核心生产环境。

比如，CV（视觉）大模型此前已成功应用在铁路巡检、国家电力巡检等场景，目前正被更多制造企业应用在工业质检环节。华为南方工厂的PCB版质检就是借助了盘古CV（视觉）大模型展开。

NLP（中文语言）大模型方面，通过跨语言模型迁移，盘古研发团队还在尝试通过中文大模型、英文大模型加速对其他小语种大模型的训练，如阿拉伯语大模型、西班牙语大模型等。

根系互补：大模型+知识计算+AI求解器形成合力

在AI落地的道路上，大模型不是孤立的单打独斗，因为人工智能算法必须结合行业Know-How和企业专有数据，才能完成通用到专用的转变。

知识计算是指利用AI技术实现机器将人类知识转化为可计算的模型。过去，各个行业都有各种形态的知识，它们存在于不同的媒介，比如各种专业书籍的学科知识，百科网站的基本常识，专家头脑中的经验沉淀等。知识计算是实现行业知识与AI结合的全新路径。

在煤炭焦化行业，配煤优化是一项颇具技术含量的工艺，是工厂煤耗和焦炭质量的关键保证。过去，传统的配煤只能依靠配煤师的个人经验，存在主观性、不稳定性而且难以传承。基于盘古Graph大模型和知识计算，华为云为鞍钢集团打造了智慧配煤解决方案。如今，操作人员只需要在系统中输入配炼焦炭的四种原料成分相关比例，系统就能自动计算焦炭中的成焦质量，配煤仅耗费1~2分钟，质量预测准确率达到95%，在确保焦炭质量的前提下，平均配煤成本下降超过5元。以年产量200万吨焦炭为例，企业可节省成本上千万元。

此外，华为云天筹AI求解器将运筹学和人工智能相结合，帮助突破业界运筹优化极限。它支持亿级规模问题的求解，求解速度最高可以提升100倍，建模效率最高提升30倍，求解效率最高提升30%。

“大模型、知识计算、求解器不是对立的，而是相辅相成的，可以是相互结合，相互帮助的。”田奇表示。

写在最后

今天，人工智能已经深刻改变了我们的生产和生活。但是从独立学科的发展来看，人工智能还处于发展早期。

“人工智能的发展处于初期阶段，科研工作者需要充分利用知识、数据、算法、算力这四个要素，建立可解释和鲁棒的人工智能理论，发展可控、可信、可靠、可扩展的人工智能技术，探索出一条适合人工智能的全新发展道路。”中国科学院院士、清华大学人工智能研究院名誉院长张钹在会上表示。

只有根系茁壮，才能枝繁叶茂，果实累累。华为云聚焦AI根技术的研发与应用，为AI产业落地探索了一条关键路径。

“华为云把AI技术和应用经验化、云化，让更多企业像使用水电一样使用全球领先的数字技术，促进AI高效地走进企业。”华为公司董事、科学家咨询委员会主任徐文伟表示。

上一篇：跨越数字化鸿沟，云原生激发的新生产力有多强大？

下一篇：山水洲城，云上长沙的新魅力

本期杂志

杂志推荐

第14期

目录