冰山數據

自动驾驶领域中的数据标注

自动驾驶汽车和辅助驾驶系统在提高驾驶体验方面发挥着关键作用。自动驾驶系统中安装了摄像头、传感器等设备,可产生大量的驾驶数据来训练机器模型。 目前ADAS系统利用计算机视觉技术,通过训练数据集帮助计算机理解并分析不同场景下的驾驶情况,从而为司机规避风险。

什么是自动驾驶数据标注?

数据标注指的是通过使用2D包围框语义分割等方法为图像或视频中的特定对象添加标签的过程。

数据标注能够帮助机器学习模型更好的理解和识别汽车传感器检测到的对象。数据标注可以保证自动驾驶系统的高效运行,因此为自动驾驶系统提供高质量的标注数据十分必要。

自动驾驶汽车通过激光雷达生成的点云图
自动驾驶汽车通过激光雷达生成的点云图

自动驾驶为什么需要数据标注?

自动驾驶汽车安装了大量传感器和摄像头,如LiDAR激光点云雷达,在运行过程中会产生大量的数据。准确的标注能够保证这些数据得到有效利用,帮助自动驾驶模型进行训练,提高模型的精准度。

一些开源的数据标注工具,例如Amazon SageMaker Ground Truth、MathWorks Ground Truth Labeler app、英特尔计算机视觉标注工具(CVAT)、微软的视觉对象标注工具(VoTT)和快速图像标注工具(FIAT),都能够帮助您提升工作效率,请参考我们此前发布的《2022年10 款最佳计算机视觉开源数据标注工具》,文章中有详细介绍各个开源标注工具的特性,能够更好地帮助您选择正确的数据标注工具。

自动驾驶数据标注的过程

在自动驾驶领域中,精准的自动驾驶模型背后有海量的数据作为支撑。我们假设有一辆汽车在不同的驾驶条件下以每小时45公里的速度行驶30万公里。通过计算,可得知汽车行驶了6700个小时。假设自动驾驶系统在6700个小时内以每秒至少10帧的速度记录,最后会生成2亿4千万帧的数据。如果平均每帧有15个对象,其中包括行驶车辆、行人、信号灯、障碍物等,最终会得到超过35亿需要标注的对象。可见,自动驾驶标注的工作量是巨大的。

自动驾驶LiDAR标注通常有以下几个步骤:

  • 激光雷达扫描。自动驾驶系统通过激光雷达扫描调取出相应的摄像机镜头,摄像机将基于激光雷达的透视图提供镜头素材。
  • 将激光雷达透视图和摄像机镜头相匹配。
  • 确定对象位置并检测,为每个对象标注3D包围框。
对点云图中德目标标注3D包围框

仅仅为汽车、行人、道路标注做出边界框标注还不够,您还需要对这些对象的属性做出具体描述。除此之外,需要标注移动物体、静止物体、紧急车辆及警示灯标志、刹车灯等对象。而且每个对象只能对应一个属性,这意味着手动标注需要处理大量的数据。

最后,为保证标注的准确性,还需要人工数据检验。如果检测每个对象需要60秒,那么完成上文提到的36亿个对象,需要至少6000万个小时,因此手动标注是一项不可能完成的任务。

如何使用自动化标注工具?

上例中我们提到,手动标注完成任务的难度很大。得益于深度学习模型的发展,自动化标注工具能够实现在低分辨率、低光照条件下完成物体的自动检测。

自动化标注首先要为任务命名,将对象属性和标签相匹配,将需要标注的对象添加到数据库中。

除此之外,还可以在自动化标注工具中添加附加功能,例如使用多边形、边框、折线等进行自动标注。自动化的标注工具能够为您节省65%的时间,提高企业的工作效率。

在我们的点云标注工具中,集合了自动贴边和连续帧自动插值算法,与手动标注相比可提3倍以上标注效率。在《冰山标注平台LIDAR标注工具更新——连续帧插值特性提升3倍以上标注效率。》一文中有详细介绍。

冰山标注平台LiDAR标注自动贴边功能
冰山标注平台LiDAR标注自动贴边功能

结论

自动化标注工具能够实现自动驾驶领域中的大规模标注,除此之外,您还需要专业的标注团队根据您的需求来定制服务。

冰山数据基于多年的自动驾驶数据标注经验,拥有自主研发的自动驾驶标注工具,可实现语义分割、点云标注、连续帧标注等操作。

若您想了解冰山数据标注工具的更多信息,请联系我们