冰山數據

什么是2D包围框标注,如何达到最佳效果?

尽管AI技术发展十分迅猛,但是计算机视觉仍然和人类感知相差甚远。训练数据和算法同样重要,通过越多高质量的数据训练,模型越能够提升准确度。我们应该如何标注数据?数据标注的类型有很多,具体使用的类型取决于您的使用场景。这篇文章会详细为您讲解2D包围框标注——一种使用最广泛的标注方式。

2D包围框标注示范

什么是包围框?

包围框标注是通过在物体边界标注矩形框,以达到训练目标检测模型的目的。首先在目标物体的边界标注最为紧密的包围框,然后赋予该包围框一个所属标签。通过包围框进行算法训练,AI模型可以很容易地在图片中搜索到目标物体的位置。

包围框标注的重要性

毋庸置疑包围框是图像标注一种关键类型,它是计算机视觉项目中数据和模型两个关键因素之一。如果没有标注数据,机器将无法识别到目标。

包围框用于目标检测任务

包围框和目标检测如何进行关联?要想搞清楚这点,首先我们需要清楚目标检测是由目标分类和位置检测构成,意味着模型需要知道目标的类型和准确的位置。但无论包围框标注有多么精细,它都不能保证最高的预测率,某些项目比如自动驾驶的车道线检测更适合使用线段标注类型,我们会在其他文章中详细讲解线段标注的内容。

常见的用例

自动驾驶

包围框训练数据帮助机器检测道路上对象,比如交通灯、车子、车道线、路标、行人等。越多,越丰富的训练数据可以帮助机器更好地识别街道上的障碍物并且做出反应。

包围框用于自动驾驶标注

智慧电商和新零售

包围框可以确保商品在零售商店和电商平台上更好地进行展现。感知模型通过相似数据集的训练可以识别对象,比如时尚商品、家具、护肤品等。这里有一些包围框用于零售场景的问题:

错误的搜索结果:错误的标签分类会导致错误的搜索结果,这是一个显著的缺点,因为搜索体验是一个电商平台留住用户的重要因素。

持续投入:所有的产品都需要被及时地标注,以确保客户不会错误新商品。另外,所有的标签都需要根据场景制定,然而在海量且持续增长的品类基础上这是一项艰巨的任务。

供应链混乱:如果您打算开展百万级产品的线上零售业务,那么您的线下库存和线上数据必须保持一致。

保险定损

在保险行业中,用包围框标注训练模型以快速进行事故定损。车顶、车身、车头、车尾、车灯和玻璃损毁是通过计算机视觉技术进行检测的,包围框标注帮助机器评估车损等级来确定理赔金额。

车损包围框标注

机器人和无人机

包围框标注不仅可以用于自动驾驶、电商、零售和保险场景,它还可以用于机器人和无人机的视觉检测任务,比如用无人机检查房屋屋顶和室外机,甚至是动物迁徙过程。通过丰富的包围框标注,机器人和无人机可以对物体进行远距离检测。

农业

使用AI对灾害特征进行检测可以提前预防农业灾害。随着智慧农业的发展,收集用于训练农业灾害和植物生长的训练数据成为巨大挑战。包围框很好地解决了这个问题,为机器识别创造了必要的条件。

注意事项

只要您遵循以下内容,包围框标注起到的效果就能达到最佳。

多样的目标尺寸

如果您标注的目标都是同样的大小,那么模型的表现就会很差。如果一个目标明显偏小,那么模型就很难检测到它。当目标偏大也是同样,当目标的像素占比更大,模型同样难以检测到。结论:注意标注目标的尺寸多样性以确保预期的结果。

包围框紧贴物体

贴合标注是重中之重,包围框要尽量和被标注物体的边界进行贴合。如果所有包围框都和物体本身有一定差距,那么IoU(模型预测框和实际物体边界的重合度)就会出现问题,完全重叠的IoU值应该为1.0。

倾斜的物体

如下图所示,人类能一眼看出包围框中的目标物体是这只手表,但是由于包围框中背景的像素占比超过了手表的占比,这会导致算法认为背景才是目标,所有这种数据最好使用多边形或者语义分割进行标注。不过如果您的训练数据够多,用包围框标注也有可能提高机器识别准确率。

包围框标注的倾斜物体案例

避免包围框重合

在任何情况下,都应该避免包围框重合,有的时候由于目标较多且杂乱,标注之后包围框全是重叠的。如果重叠框不属于同一个类别那么效果会更差。如果重叠过多,模型将无法区分包围框和物体的关联关系,如果实在无法避免重叠,我建议您使用多边形或语义分割进行像素级标注。

结语

当我们说起计算机视觉技术,首先想到的就是包围框标注,包围框被应用于多个行业的视觉感知目标检测,一定程度上推动了计算机视觉的发展。

我们希望通过本文让您对包围框如何应用于目标检测任务有初步的了解,如果您有任何包围框标注项目需要支持,欢迎随时联系我们