星尘数据是华为云ModelArts首家标注平台合作伙伴,双方联合开发的标注训练一体化方案已应用于多个车企项目,2023年起,星尘数据标注平台通过华为云技术认证,成为其AI开发平台的核心数据服务伙伴。
A市地铁是全球领先的城市轨道交通系统,也是国际地铁联盟(CoMET)的成员。随着城市发展加速,原有系统面临以下挑战:地铁调度指挥中心正在部署智能分析系统,通过“感知-分析-决策-执行”的数字化闭环,实现对生产工作的精准控制与高效管理 。
1、 数据格式复杂:
数据格式复杂,需融合的视频流(RTSP/RTMP协议传输的H.264/H.265编码监控视频)、SCADA实时数据(OPC UA接口的电力参数与设备状态时序信号)、工单系统结构化记录(SQL数据库存储的维护日志)等数据,在格式、频率、维度上存在显著差异。视频流包含每秒25帧的4K分辨率图像(单摄像头日数据量达200GB),需专用解码器提取行为特征;SCADA数据则以毫秒级频率刷新(如接触网电压波动曲线),依赖时间序列分析引擎;工单数据涉及自然语言描述(如故障文本报告)与设备编码对照表,需NLP技术映射实体关系。
更严峻的是多源数据时空基准不统一,视频流时间戳与SCADA采样周期存在300ms级偏差,轨道地理坐标系统与设备拓扑模型需动态校准。数据孤岛导致跨系统分析时需开发定制化适配器(如将视频流GPS坐标转换为SCADA设备拓扑节点ID),单项目接口开发耗时占整体工期40%。某地铁实测显示,因视频分析帧率(30fps)与SCADA数据采样率(10Hz)未对齐,导致大客流预警模型误报率高达22%。
2、 难例标注困难:
不同场景的“难例”标准不同,完全人工标注需要高成本的工程师。不同业务场景的标注标准差异显著且动态变化,如设备运维需结合材料学与电气特征(轨道裂缝检测精度需达0.2mm级),乘客服务需融合视频、票务、语音等多模态数据,信号控制则依赖跨区段时序信号关联分析。完全依赖人工标注需高薪工程师团队(年均成本超80万元/人)投入70%以上工时,且跨领域知识融合困难导致标注效率低下(单场景标注耗时超120小时/万条)。
更严峻的是设备异构性(多厂商信号机特征不兼容)迫使标注规则频繁重构,人工标注错误率高达8.7%,单次漏标可能引发500万元级事故损失。当前AI辅助标注在长尾场景(极端天气/混合线路)中预标注误判率仍超18%,形成“高成本、低效率、高风险”三重困局。
1、自主研发MorningStar垂域模型平台对齐来自不同数据源的时间戳,多模态数据同时处理和标注,覆盖模型开发各关键环节,包括数据管理、数据处理、模型动态训练、模型评估、人类反馈、数据挖掘等,提升模型迭代效率数倍。
2、智能标注支持RESTFul API的方式接入自动化标注模型,结合辅助标注算法对未经过标注的数据进行自动标注,大幅提升数据标注效率。
3、该方案在AI数据全行业深耕的扎实knowhow中孵化诞生,有效帮助客户解决AI落地中的痛点问题,助力客户地铁系统智慧升级,打造AI平台与大模型融合,实现了城轨云平台、AI开发平台与大模型应用场景的从0到1突破。

华为云在解决方案中的价值:
1、基于ModelArts一站式AI开发平台共同开发和优化算法、统一纳管算法、自主开发算法模型,可节省模型升级费用约20%。
2、基于大模型更强泛化能力、更高模型优化效率、更精准模型识别精度提高模型开发效率1倍,提高模型精准度5%~20%。

从难例标注的角度来说,星尘数据的MorningStar确实给了我们很多惊喜。难例分析本身是极其依靠经验的,但是星尘数据的标注和分析给我们的日常工作提供了大量的指导性意见,确实帮助我们提高了效率。
华为云在数据方面我们是放心的,星尘数据在AI方面给了我们很多帮助,二者的结合让我们无论在安全方面还是在技术方面都很放心,这种合作也是我们作为数据工作人员一直所期待的。
1、智能化能力建设
通过华为云,星尘数据与A市地铁数据系统实现打通,在保证数据安全的情况下搭建智能分析系统,完成供电智能管理、设备异常状况监控、乘客异常行为检测等多个业务场景的智能化能力建设,系统平均准确率高达97%,响应速度比人工快10倍。
2、标注难例攻克
借助星尘数据与华为云的AI数据闭环与数据标注平台MorningStar,实现了难例高准确性的标注,并优化了整体流程。数据通过SCADA系统采集和显示,实时监测车辆段10kV供电系统运行状态,及时发现异常并处理,为运维人员大大减轻了工作量。