|
|
视觉-语言-动作模型的混合训练 大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 · |
|
|
VLA-RFT:在世界模拟器中使用经过验证的奖励对视觉-语言-动作进行强化微调 大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 · |
|
|
高效的视觉-语言-动作操控中动作-觉察的动态剪枝 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
从自我为中心的视频构建视觉-语言-行动模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
自动驾驶轨迹预测的大型基础模型:综述(下) 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
自动驾驶轨迹预测的大型基础模型:综述(上) 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
VLA-LPAF:视觉-语言-动作模型的轻量级视角-自适应融合,实现更不受约束的机器人操作 大语言模型和具身智体及自动驾驶 · 公众号 · · 2 周前 · |
|
|
通过世界建模进行潜动作预训练 大语言模型和具身智体及自动驾驶 · 公众号 · · 2 周前 · |
|
|
学得越好,修剪得越聪明:通过可微分 token 修剪实现高效的视觉-语言-动作模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 2 周前 · |
|
|
视觉-语言-动作模型从边缘到云 GPU 的跨平台扩展 大语言模型和具身智体及自动驾驶 · 公众号 · · 2 周前 · |