比美国Figure AI更进一步！“稚晖君”团队抛出最新具身基座大模型GO-1，提出ViLLA架构

大数据文摘 · 公众号 · 大数据 · 2025-03-10 18:00

文章预览

大数据文摘受权转载自头部科技文丨谭梓馨具身智能赛道正在迎来新一轮技术变革，不仅仅是人形机器人硬件技术和控制算法框架越来越成熟，也来源于机器人底座大模型的不断刷新。今天，“稚晖君”的智元机器人团队抛出一个重磅研究：通用具身基座大模型 Genie Operator-1（GO-1）。论文显示，该模型开创性地提出了一个Vision-Language-Latent-Action (ViLLA) 架构，由VLM(多模态大模型) + MoE(混合专家)组成，可以利用人类视频学习，完成小样本快速泛化，在现实世界的灵巧操作和长时域任务中展现出了卓越能力。数周前，美国明星人形机器人公司Figure AI曾推出一个专为人形机器人打造的通用“视觉-语言-动作” (VLA) 基座模型Helix引发行业广泛关注，它能将感知、语言理解和学习控制统一起来，展示效果十分惊人。与Figure AI的Vision-Language-Action (VLA) 架构相 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博