注册登录

专栏名称: 自动驾驶之心

自动驾驶开发者社区，关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等，坚持为领域输出最前沿的技术方向！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

普象工业设计小站 · 中国馒头在法国面包节杀疯了！网友：配上老干妈绝了· 昨天

普象工业设计小站 · 年度最佳设计「粉红色跷跷板」，横跨美墨边境！ ...· 2 天前

顶尖文案TOPYS · 有奖征集丨一句slogan换一辆车的泼天富贵 ...· 3 天前

普象工业设计小站 · “设计1只1000块的大闸蟹”，甲方逼疯设计师？· 5 天前

顶尖文案TOPYS · 王妈塌房，管我这个打工人什么事｜清醒蹦迪· 6 天前

今天看啥 › 专栏 › 自动驾驶之心

ADriver-I：自动驾驶的一个通用世界模型

自动驾驶之心 · 公众号 · · 2023-11-25 00:00

作者 | 黄浴编辑 | 汽车人原文链接：https://zhuanlan.zhihu.com/p/668364664点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【世界模型】技术交流群本文只做学术分享，如有侵权，联系删文11月22日论文“ADriver-I: A General World Model for Autonomous Driving“，来自旷视科技等的论文。通常，自动驾驶采用模块化设计，将整个堆栈分为感知、预测、规划和控制部分。尽管可以解释，但这种模块化设计往往会引入大量冗余。近年来，多模态大语言模型（MLLM）和扩散模型技术在理解和生成能力方面表现出了优越的性能。在本文中，我们首先引入了交错的视觉-动作对的概念，它统一了视觉特征和控制信号的格式。基于视觉-动作对，构建一个基于MLLM和扩散模型的自动驾驶通用世界模型，称为ADriver-I。它以视觉-动作对为输入， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

普象工业设计小站 · 中国馒头在法国面包节杀疯了！网友：配上老干妈绝了

昨天

普象工业设计小站 · 年度最佳设计「粉红色跷跷板」，横跨美墨边境！外媒：背后理念，令人感动！

2 天前

顶尖文案TOPYS · 有奖征集丨一句slogan换一辆车的泼天富贵，仅创意人可见

3 天前

普象工业设计小站 · “设计1只1000块的大闸蟹”，甲方逼疯设计师？

5 天前

顶尖文案TOPYS · 王妈塌房，管我这个打工人什么事｜清醒蹦迪

6 天前

中国基金报 · 刚刚，超200股跌停！A股蒸发3万亿，创业板暴跌近6%，人均没了2万块！大跌原因找到了...网友：又见证历史！

3 年前

果业信息网 · 苹果树开春第一肥，到底要上什么肥？

4 年前

中国企业家杂志 · 王思聪杀死微博

5 年前

史事挖掘机 · 李小龙生前门下的九个弟子，个个都处于世界巅峰，他们都是谁？

5 年前

WiFi万能钥匙 · 她将唐朝美女画成猫，萌化14万粉丝，原来被猫统治的世界是这样的···

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号