看啥推荐读物
专栏名称: arXiv每日学术速递
跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息
今天看啥  ›  专栏  ›  arXiv每日学术速递

多个SOTA !OV-Uni3DETR:提高3D检测在类别、场景和模态之间的普遍性(清华&港大)

arXiv每日学术速递  · 公众号  ·  · 2024-04-09 13:10
论文作者 | Zhenyu Wang编辑 | 自动驾驶之心写在前面&笔者的个人理解这篇论文聚焦于3D目标检测的领域,特别是Open-Vocabulary的3D目标检测。在传统的3D目标检测任务中,系统旨在预测真实场景中物体的定向3D边界框和语义类别标签,这通常依赖于点云或RGB图像。尽管2D目标检测技术因其普遍性而迅速发展,但相关研究表明,3D通用检测的发展相比之下显著滞后。当前,大多数3D目标检测方法仍然依赖于完全监督学习,并受到特定输入模式下完全标注数据的限制,只能识别训练过程中出现的类别,无论是在室内还是室外场景中。这篇论文指出,3D通用目标检测面临的挑战主要包括:现有的3D检测器仅能在封闭词汇的情况下工作,因此只能检测已见过的类别。紧迫需要Open-Vocabulary的3D目标检测,以识别和定位训练过程中未获取的新类别目标实例。然而,现有的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照