专栏名称: arXiv每日学术速递
跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息
目录
相关文章推荐
中国中医  ·  发布会 | ... ·  4 小时前  
今天看啥  ›  专栏  ›  arXiv每日学术速递

暴拉MagicDrive 20%!西交DualDiff:自动驾驶首个MPI引导的环视视频生成奖励模型~

arXiv每日学术速递  · 公众号  ·  · 2025-04-03 13:16
    

文章预览

题目:DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance paper:https://www.alphaxiv.org/abs/2503.03689 github:https://github.com/yangzhaojason/DualDiff DualDiff: Dual-branch Diffusion Model for Autonomous Driving with Semantic Fusion accepted by ICRA2025. 在自动驾驶领域,如何高精度且高保真地重建驾驶场景是一个关键挑战。当前的方法往往采用有限的条件信息来生成场景,例如依赖3D边界框或鸟瞰图(BEV)道路地图对前景和背景进行控制。这类简化的条件编码存在明显局限,难以全面刻画真实驾驶场景的复杂性,导致与基于视角的图像生成模型不匹配,从而出现生成结果不准确等问题。具体来说,现有方案主要面临以下痛点: 条件编码不充分 :许多方法使用的条件表示(如3D边界框、BEV语义图等)过于简化,无法充分表征场景中的丰富信息。这种欠完善的条件输入会与图 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览