AI工业化开发新模式 AI工业化开发新模式

传统“作坊式"AI开发存在多类问题

【问题1】针对不同场景,AI应用重复性定制化开发,从数据处理,模型选择,模型训练,模型微调与优化,投入大量人力和时间

【问题2】小模型性能难达标

【问题3】定制化小模型换应用场景后模型难适配,需重新开发

盘古大模型-AI开发新模式

【1】 适配多场景. 突破性实现AI模型通用、泛化和复制,相对于作坊式开发,AI工业化开发效率提升10~100倍

【2】AI大模型具备更佳的性能,实际综合性能比定制化模型提升10%

盘古系列AI大模型

NLP大模型
内容生成丨内容理解
CV大模型
分类丨分割丨检测
多模态大模型
跨模态检索丨跨模态生成丨看图说话
科学计算大模型
分子大模型丨金融大模型丨空气大模型

  • NLP大模型

  • CV大模型

NLP大模型

业界首个千亿参数中文大模型

盘古NLP大模型预训练阶段学习超40TB文本数据,并通过行业数据的小样本调优,提升模型在场景中的应用性能

优势

预训练阶段沉淀了大量的通用知识,同时既能做生成又能做理解的特性让大模型有能力支持行业知识库和数据库的嵌入,对接行业经验

encoder-decoder架构基础上植入了特点训练技巧、方法,性能优异。中文权威CLUE榜单分类任务、阅读理解任务,总成绩排名第一;Rouge Score平均分0.53

基于提示(prompt-based)调优、动态冰化等一系列正则化技术,实现小样本学习任务上超越GPT系列

CV大模型

超30亿参数业界最大CV大模型

盘古CV大模型,解决AI工程难以泛化和复制的问题。现有的AI工程需要针对不同场景做定制化开发,费时费力;盘古CV大模型的出现,使AI开发进入工业化模式,即一套流水线能够复制到不同的场景中去,大大节约研发的人力和算力。

优势

盘古CV大模型首次兼顾图像判别与生成能力,能同时满足底层图像恢复与高层语义理解需求

能够简单高效融合行业知识,快速适配各种下游任务。盘古CV大模型已经在100余项实际任务中得到验证,大幅提升了业务测试精度,节约90%以上的研发成本