专栏名称: 自动驾驶专栏
自动驾驶专栏,持续聚焦自动驾驶最新资讯,并且分享行业内相关技术研究。欢迎志同道合的伙伴关注,并参与交流或者分享。
今天看啥  ›  专栏  ›  自动驾驶专栏

【CVPR 2025】MPDrive:通过基于标记的提示学习来提高自动驾驶的空间理解能力

自动驾驶专栏  · 公众号  ·  · 2025-04-04 10:10
    

文章预览

点击下方 卡片 ,关注“ 自动驾驶专栏 ”公众号 自动驾驶干货 ,即可获取 论文链接: https://arxiv.org/pdf/2504.00379 摘要 本文介绍了 MPDrive:通过基于标记的提示学习来提高自动驾驶的空间理解能力。自动驾驶视觉问答(AD-VQA)旨在根据给定的驾驶场景图像回答与感知、预测和规划相关的问题,它严重依赖于模型的空间理解能力。先前的工作通常通过坐标的文本表示来表达空间信息,导致视觉坐标表示和文本描述之间存在语义差距。这种疏忽阻碍了空间信息的准确传输,增加了表达负担。为了解决这个问题,本文提出了一种新的基于标记的提示学习框架(MPDrive),它通过简洁的视觉标记来表示空间坐标,确保了语言表达的一致性,并且提高了AD-VQA中视觉感知和空间表达的准确性。具体而言,本文通过采用检测专家以使用数值标签来覆盖目标区域,从 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览