今天看啥  ›  专栏  ›  自动驾驶之心

ADriver-I:自动驾驶的一个通用世界模型

自动驾驶之心  · 公众号  ·  · 2023-11-25 00:00
作者 | 黄浴  编辑 | 汽车人原文链接:https://zhuanlan.zhihu.com/p/668364664点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【世界模型】技术交流群本文只做学术分享,如有侵权,联系删文11月22日论文“ADriver-I: A General World Model for Autonomous Driving“,来自旷视科技等的论文。通常,自动驾驶采用模块化设计,将整个堆栈分为感知、预测、规划和控制部分。尽管可以解释,但这种模块化设计往往会引入大量冗余。近年来,多模态大语言模型(MLLM)和扩散模型技术在理解和生成能力方面表现出了优越的性能。在本文中,我们首先引入了交错的视觉-动作对的概念,它统一了视觉特征和控制信号的格式。基于视觉-动作对,构建一个基于MLLM和扩散模型的自动驾驶通用世界模型,称为ADriver-I。它以视觉-动作对为输入, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照