(图片付费下载于视觉中国)
今天跟大家推荐一篇前几天新出的投向TPAMI的论文:Imbalance Problems in Object Detection: A Review,作者详细考察了目标检测中的不平衡问题(注意不仅仅是样本中的不平衡问题)及其解决方案,是目标检测领域目前最新的也是非常独特的综述。
读完之后,你会发现,原来新出的这么多算法,多半是为了解决不平衡问题!
以下是作者信息:
该文作者均来自土耳其中东科技大学。
什么是不平衡问题?
弄清这个问题,非常重要,作者让我们重新审视目标检测的数据和算法流程,对于任何输入的特性的分布,如果它影响到了最终精度,都是不平衡问题。
一个我们最常想到的不平衡问题是:目标类别的不平衡。比如猫狗数据标注数量差异比较大。
但这只是类别个数这一个输入特性。
作者将不平衡问题分成四种类型,如下表:
1. 类别不平衡:前景和背景不平衡、前景中不同类别输入包围框的个数不平衡;
2. 尺度不平衡:输入图像和包围框的尺度不平衡,不同特征层对最终结果贡献不平衡;
3. 空间不平衡:不同样本对回归损失的贡献不平衡、正样本IoU分布不平衡、目标在图像中的位置不平衡;
4. 目标函数不平衡:不同任务(比如回归和分类)对全局损失的贡献不平衡。
作者这个定义和总结非常全面,想想之前很多算法也是为了解决上述某一个不平衡问题。
主流目标检测算法的训练大致流程,与四种不平衡问题的示例:
作者将目前上述不平衡问题及相应目前学术界提出的解决方案,融合进了下面这张超有信息量的图(请点击查看大图):
作者对文献的收集总结非常细致全面,很多论文都是今年才出的。这块内容非常丰富,建议大家阅读论文原文。
作者又从方法的角度总结了这些解决不平衡问题的目标检测算法(请点击查看大图):
不平衡问题,当然并没有完全被解决,作者在Github上建了项目,分类别跟踪相关技术发展:
https://github.com/kemaloksuz/ObjectDetectionImbalance
这篇论文综述对该领域进行了详尽的调查,非常值得做相关方向的同学参考。
论文地址:
https://arxiv.org/abs/1909.00169
◆
精彩推荐
◆
推荐阅读
dfuse、慢雾科技、MYKEY共同出席,与你探讨区块链数据架构和项目上链那些事!
大数据工程师手册:全面系统的掌握必备知识与工具
演讲实录:知乎算法团队负责人孙付伟:Graph Embedding在知乎的应用实践
NASNet:神经架构搜索网络在图像分类中的表现
实操 | 从0到1教你用Python来爬取整站天气网
我们到底该如何看待6G?
互联网大佬为什么爱唱歌
惊呆!这辆悍马自己在跑跑跑跑跑跑跑!
你点的每个“在看”,我都认真当成了喜欢
转载:https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/100918824