华为云计算 云知识 数据采集服务-用户案例

数据采集服务-用户案例

某自动驾驶解决方案公司:驾驶员状态采集、自动驾驶数据采集
一、需求 1) 此项目车内部分主要采集驾驶员(活体、假体)的驾驶状态,包括驾驶员喝水、抽烟、接听/拨打电话、吃零食、打哈欠等状态,同时综合驾驶员的实际状态(驾驶员佩戴墨镜、面具、口罩等遮挡物)进行采集。采集总人数数千人,每位被采集人均需要签署数据授权书; 2)此项目车外部分主要采集汽车在行驶状态(从起步到停车)下的完整数据,包括道路图片数据、道路激光雷达点云数据、道路视频数据等。采集总数据量庞大,涵盖各天气情况下的车辆行驶数据。 二、项目难点 1)采集种类复杂 2)对于车身上的多个传感器均有要求 3)对于特殊天气的采集开展不便 4)数据整理耗时较长 三、解决方案 1)平台使用了一套专门的算法保障采集数据的质量,包括查重、曝光率检查等; 2)特殊天气的采集优先,碰到特殊天气先采集该环境下的数据; 3)在人员采集方面,使用了专属的采集软件,优化了采集时间和流程,使得人员采集周期大大缩短。
某TOP人工智能公司:小语种多场景图片采集
一、需求 多国小语种多场景图片采集:图片分辨率200dpi以上,每张图可辨认字符占比不低于90%,无逆光、曝光现象,非合成图片。 二、项目难点 1)稀缺语言数据采集困难。由于该项目主要是对稀缺语言进行图片、语音以及手写体的采集,因此需要懂该稀缺语言的人在当地进行收集; 2)由于地域问题以及采集需求复杂,数据的采集与收集方式成为一个比较大的问题; 3)多形式与多种复杂场景的数据给质检带来比较大的难题。 三、解决方案 1)不断丰富渠道资源,保证采集数据的种类和数量; 2)图片查重:通过技术手段对采集到的原始图片进行image hasing。依据计算图片hash值相互间的distance来筛选出重复或极其相似的图片进行清理,只保留唯一有效的的图片用以提高总体数据的质量,即:每个单位采集图片和后续标注数据结果的唯一性; 3)通过读取图片数字化信息中的dpi值来进行图片的自动筛选,获取分辨率大于200dpi的图片; 4)场景类采集范围占比:基于DAG的灵活配置 (有向无环图) ,需要的不同场景采集数据会被区分为从起点出发的不同流水线进行作业。这就保证了不同场景采集的数据会在一个项目内被独立的流水线区分处理。便于管理已标注数据量和采集范围内规定的数据量的占比。
查看详情

云市场免费试用中心

50+款产品限时免费试用
免费体验
数据采集服务

意见反馈

0/200

提交 取消

反馈提交失败!请稍后重试!
云服务器0元领取 | 免费试用云产品
相关推荐