立体框标注介绍

什么是立体框标注？

立体框（cuboid），在业界经常被称为“伪3D”，或“2.5D”，是一种通过在2D图像上标注三维框的行为，用这种数据训练计算机视觉模型，有助于模型即使在2D视觉下也可以对真实世界有3D姿态预测的能力。

通过标注立体框，模型可以进行深度识别，甚至可以仅通过2D图片重构三维的真实世界场景，它是机器学习中重要的因素之一，因为它允许机器识别三个维度。

立体框标注主要用来训练不同场景的机器人，它有助于创建更灵敏的感知模型，使机器人能够自动化工作而无需人工干预或支持。从 2D 相机采集的图像进行立体框标注，为机器人的图像感知提供动力，这些图像在各重要领域都有应用。

立体框标注帮助检测自动驾驶车辆的运动轨迹及其尺寸。它帮助自动驾驶汽车测量每个障碍物与车辆的距离。

立方体标注使室内物体（如家具）可以通过计算机视觉被人工智能感知模型识别。它可以检测具有精确尺寸和精确属性的物品，有助于准确和高质量地识别室内物体，如沙发、桌子和其他家具。

立体框标注和2D包围框标注有类似之处，但由于在2D图像上感知三维空间，需要较强的空间想象力和直观易用的标注工具。

在我们的图像标注服务中，立体框是重要的环节之一，我们拥有超过万人的世界各地的图像标注专家，并通过高度自动化的冰山标注平台提供该服务。