SLAM如何与具身导航结合？

新机器视觉 · 公众号 · AI · 2025-05-20 08:33

文章预览

作者 | momo 编辑 | 3D视觉之心原文链接： https://www.zhihu.com/question/667033549/answer/1894438516257162465 在具身智能、端到端发展大环境下， SLAM是否能与具身导航(物体导航、视觉语言导航、命令导航等范式)进行结合？显然是可以的，但是这种A+B的方式是不是optimal solution，那就是另一个问题了。优点首先，将SLAM当中的相关概念引入到Zero-Shot Object Navigation (ZSON)已经有很多工作尝试在做了，在这种偏向于Embodied Navigation的task setup中，一般倾向于采用semantic open-vocabulary map/scene graph表征的形式将其和输入的语言经过clip编码后的特征计算相似度，从而相比于纯几何based的地图更准确的定位到你想要的语义概念对应的实际坐标，在Concept-graph[1]出现后，NIPS 2024 的SG-Nav[2]已经将类似的obejct-centric scene graph作为prompt来强化LLM对这类空间导航任务的理解能力，这类方法基本 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博