伙伴名称

星尘数据

所属行业

能源

概述

星尘数据是​​华为云ModelArts首家标注平台合作伙伴​​,双方联合开发的标注训练一体化方案已应用于多个车企项目,2023年起,星尘数据标注平台通过华为云技术认证,成为其AI开发平台的核心数据服务伙伴。 星尘聚集了国内外人工智能科学家,数据处理数过亿,立志打造世界顶尖AI数据中台系统。

业务背景

山西省煤矿资源丰富,煤矿产业上下游企业众多。与此同时,山西省政府对推动当地能源转型、推进煤矿产业智能化发展的意愿十分强烈。

煤企多为省属国企,政府对企业较强的统筹能力是推动煤矿产业智能化发展和数字化转型成功的优势条件。为响应省政府关于煤炭工业互联网平台建设的政策要求,2023 年 5 月,由省属国企牵头成立的晋云科技,打造全国首个省级煤炭工业互联网平台。该平台依托山西海量煤矿场景数据,搭载华为盘古大模型及智算中心,为生态企业提供算力、数据等资源,推动智能化技术攻关和产业升级,既承接政府能源转型战略,又解决煤企实际需求。

业务挑战
  • 痛点1:模型适配难

    垂域模型落地依赖企业私有化数据的哺育,公开模型解决不了企业的业务场景问题。

  • 痛点2:缺乏系统性

    缺少一套AI原生的平台能解决从企业数据、模型训练到AI应用的端到端的落地问题,包括高效的数据处理、模型训练等。

  • 痛点3:数据挖掘难

    工具链多样,对接成本高,数据孤岛和流程断点问题严重,数据挖掘依赖自聘的大量算法工程师,需要高效的数据挖掘工具链。

  • 痛点4:数据效率低

    数据标注缺乏高效且专业的解决方案,需要专业且高度自动化的数据标注产品解决规模化的数据标注业务诉求。

解决方案

星尘自研MorningStar一站式数据闭环解决方案,提升模型迭代效率数倍,突破模型上限数十个百分点。

覆盖AI数据闭环各关键环节,包括数据可视化管理、模型评估、数据处理流程编排、人类反馈、难例发现、数据挖掘、数据合成等,赋能AI加速落地,帮助企业级AI高效高质量发展。

数据平台解决方案,帮助客户落地智能化AI模型训练的各类数据要素生产的需求:

1、数据管理:提供对文本、图片、视频等数据集的可视化管理能力。

2、数据标注:提供对文本、图片、视频等数据的标注功能,可生产用于CV、NLP算法训练的训练数据。

3、项目管理:提供大规模标注项目管理功能,包括人员管理、项目流程自定义、标注工具配置等,帮助高效管理生产质量、进度、成本。

4、权限管理:提供基于团队和角色的权限管理功能,对数据集、标注项目等进行精细化权限管理。

使用的华为云服务与关键价值:

1、平台体验:为客户提供一站式采购体验:选购—下单—部署—售后。

2、华为云能力:通用算力平台、AI算力平台、工业PaaS平台,快速部署搭建,整合星尘能力为客户搭建了AI基础设施。

3、方案价值:华为云通过星尘数据CV标注能力快速实现高质量数据集的构建,并通过ModelArts快速开启矿山AI大模型的训练,助力矿山AI大模型实现滚筒、护帮板防碰撞检测、着装检测;皮带卡子损坏检测、主运异物识别、刮板运输机异物识别;前探梁未接顶识别、未进行前探梁支护识别、敲帮问顶作业检测、探放水作业钻杆深度合规检测、防冲卸压钻杆深度合规检测等多种CV检测算法。

华为云与星尘数据快速响应我们的需求,并较快的完成了部署上线,使用过程中华为云和星尘数据提供了完善的操作指导。这个解决方案有效的帮助我们实现了AI产业赋能的基础支撑落地,为我们发展相关生态、产业升级和创新,将资源优势转化为产业优势打下了良好的基础!

客户效益

1、产业生态效益

依托搭建的国家级产业集群,打通政、产、学、研、用协同链路,实现各方共建共享共赢,既为客户创新发展提供优质生态环境,又助力客户将自身资源优势高效转化为产业竞争优势。

2、数据管理与生产提效

一方面通过多模态数据可视化,清晰呈现数据规模、归属、处理路径,提升数据复用与共享效率;另一方面凭借可编排的处理流程、可追溯的多版本数据管理,以及 70% 以上主流任务自动化率的人类反馈系统,结合 DAG 工作流与协同管理功能,实现数据生产质量与效率双提升,同时支撑企业模型可再生、实验可复现。

3、数据价值挖掘

借助特征可视化、跨模态检索等数据挖掘工具,帮助客户充分发掘数据全维度价值;同时依托算法指标跟踪、自定义指标及推理结果可视化能力,快速定位模型缺陷、实现难例发现与主动学习,大幅提升模型迭代效率并突破效果上限。

case_like

成为华为云伙伴


携手共赢
成为合作伙伴