ManiSkill：具有大规模演示的可泛化操作技能基准

大语言模型和具身智体及自动驾驶 · 公众号 · · 2024-09-12 00:10

文章预览

21年11月来自UCSD的论文“ManiSkill: Generalizable Manipulation Skill Benchmark with Large-Scale Demonstrations”。来自 3D 视觉输入的目标操作，对构建可泛化的感知和策略模型提出了许多挑战。然而，现有基准测试中的 3D 资源，大多缺乏与现实世界类内拓扑和几何复杂性相一致的 3D 形状多样性。提出 SAPIEN （“SAPIEN: A simulated part-based interactive environment”）操作技能基准测试 ( ManiSkill )，在全物理模拟器中对不同目标的操作技能进行基准测试。ManiSkill 中的 3D 资源，包括大量类内拓扑和几何变化。任务经过精心选择，涵盖不同类型的操作挑战。基于3D 视觉的最新进展，应该定制基准，以便挑战对从事 3D 深度学习的研究人员具有吸引力。为此，模拟一个移动的全景相机，它返回以自我为中心的点云或 RGB-D 图像。此外，ManiSkill 能够为对操作研究感兴趣的广大研究人员提供 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博