今天看啥  ›  专栏  ›  新机器视觉

SLAM如何与具身导航结合?

新机器视觉  · 公众号  · AI  · 2025-05-20 08:33
    

文章预览

作者 | momo  编辑 | 3D视觉之心 原文链接: https://www.zhihu.com/question/667033549/answer/1894438516257162465 在具身智能、端到端发展大环境下, SLAM是否能与具身导航(物体导航、视觉语言导航、命令导航等范式)进行结合 ? 显然是可以的,但是这种A+B的方式是不是optimal solution,那就是另一个问题了。 优点 首先,将SLAM当中的相关概念引入到Zero-Shot Object Navigation (ZSON)已经有很多工作尝试在做了,在这种偏向于Embodied Navigation的task setup中,一般倾向于采用semantic open-vocabulary map/scene graph表征的形式将其和输入的语言经过clip编码后的特征计算相似度,从而相比于纯几何based的地图更准确的定位到你想要的语义概念对应的实际坐标,在Concept-graph[1]出现后,NIPS 2024 的SG-Nav[2]已经将类似的obejct-centric scene graph作为prompt来强化LLM对这类空间导航任务的理解能力,这类方法基本 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览