今天看啥  ›  专栏  ›  大数据文摘

谷歌发布5620亿参数多模态模型PaLM-E,机器人操控无所不能

大数据文摘  · 公众号  · 大数据  · 2023-03-09 12:24
大数据文摘授权转载自夕小瑶的卖萌屋作者:CoCo酱ChatGPT已经是大模型的天花板了吗?不!没有做不到,只有想不到。谷歌出手,果然不会让人失望!谷歌悄悄上线了一个炸弹级模型——足足有5620亿参数!PaLM-E 将真实世界的传感器信号与文本输入相结合,建立语言和感知的链接。规模最大的模型“PaLM-E-562B”具有562B个参数,将540B的PaLM和22B的ViT集成在一起,这是目前报道的最大的视觉-语言模型。模型输入包括视觉、连续状态估计值和文本输入。作者在多个任务(包括顺序机器人操作规划、视觉问答和字幕生成)中进行了端到端的训练,并通过评估表明,其模型能够有效地解决各种推理任务,并且在不同的观察模态和多个实体上表现出了积极的转移。该模型在进行机器人任务训练的同时,还具有先进的视觉-语言任务表现,并随着规模的增大保持了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照