专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
今天看啥  ›  专栏  ›  大数据文摘

比美国Figure AI更进一步!“稚晖君”团队抛出最新具身基座大模型GO-1,提出ViLLA架构

大数据文摘  · 公众号  · 大数据  · 2025-03-10 18:00
    

文章预览

大数据文摘受权转载自头部科技 文丨谭梓馨 具身智能赛道正在迎来新一轮技术变革,不仅仅是人形机器人硬件技术和控制算法框架越来越成熟,也来源于机器人底座大模型的不断刷新。 今天,“稚晖君”的智元机器人团队抛出一个重磅研究:通用具身基座大模型 Genie Operator-1(GO-1)。 论文显示,该模型开创性地提出了一个Vision-Language-Latent-Action (ViLLA) 架构,由VLM(多模态大模型) + MoE(混合专家)组成,可以利用人类视频学习,完成小样本快速泛化,在现实世界的灵巧操作和长时域任务中展现出了卓越能力。 数周前,美国明星人形机器人公司Figure AI曾推出一个专为人形机器人打造的通用“视觉-语言-动作” (VLA) 基座模型Helix引发行业广泛关注,它能将感知、语言理解和学习控制统一起来,展示效果十分惊人。 与Figure AI的Vision-Language-Action (VLA) 架构相 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览