讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
目录
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

ManiSkill:具有大规模演示的可泛化操作技能基准

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-09-12 00:10
    

文章预览

21年11月来自UCSD的论文“ManiSkill: Generalizable Manipulation Skill Benchmark with Large-Scale Demonstrations”。 来自 3D 视觉输入的目标操作,对构建可泛化的感知和策略模型提出了许多挑战。然而,现有基准测试中的 3D 资源,大多缺乏与现实世界类内拓扑和几何复杂性相一致的 3D 形状多样性。提出 SAPIEN (“SAPIEN: A simulated part-based interactive environment”)操作技能基准测试 ( ManiSkill ),在全物理模拟器中对不同目标的操作技能进行基准测试。ManiSkill 中的 3D 资源,包括大量类内拓扑和几何变化。任务经过精心选择,涵盖不同类型的操作挑战。基于3D 视觉的最新进展,应该定制基准,以便挑战对从事 3D 深度学习的研究人员具有吸引力。为此,模拟一个移动的全景相机,它返回以自我为中心的点云或 RGB-D 图像。此外,ManiSkill 能够为对操作研究感兴趣的广大研究人员提供 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览