多个SOTA ！OV-Uni3DETR：提高3D检测在类别、场景和模态之间的普遍性（清华&港大）

arXiv每日学术速递 · 公众号 · · 2024-04-09 13:10

论文作者 | Zhenyu Wang编辑 | 自动驾驶之心写在前面&笔者的个人理解这篇论文聚焦于3D目标检测的领域，特别是Open-Vocabulary的3D目标检测。在传统的3D目标检测任务中，系统旨在预测真实场景中物体的定向3D边界框和语义类别标签，这通常依赖于点云或RGB图像。尽管2D目标检测技术因其普遍性而迅速发展，但相关研究表明，3D通用检测的发展相比之下显著滞后。当前，大多数3D目标检测方法仍然依赖于完全监督学习，并受到特定输入模式下完全标注数据的限制，只能识别训练过程中出现的类别，无论是在室内还是室外场景中。这篇论文指出，3D通用目标检测面临的挑战主要包括：现有的3D检测器仅能在封闭词汇的情况下工作，因此只能检测已见过的类别。紧迫需要Open-Vocabulary的3D目标检测，以识别和定位训练过程中未获取的新类别目标实例。然而，现有的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博