专栏名称: 智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
目录
相关文章推荐
今天看啥  ›  专栏  ›  智驾实验室

Proto0cc: 使用双分支编码器-原型查询解码器进行准确、高效的3D占用预测,登顶 Occ3D-nuScenes 基准测试!

智驾实验室  · 公众号  ·  · 2025-02-13 08:00
    

文章预览

ADAS  Laboratory 点击上方 蓝字 关注  智驾实验室           加入【 智驾实验室 】交流群, 获取更多内容和资料 在本文中,作者提出了ProtoOcc,这是一种新型的三维占用状态预测模型,通过深度语义理解来预测三维 Voxel 的占用状态和语义类别。 ProtoOcc包含两个主要组件:双分支编码器(DBE)和原型 Query 解码器(PQD)。DBE通过双分支结构结合多尺度的三维 Voxel 和鸟瞰图表示,生成新的三维 Voxel 表示。这种设计通过为BEV表示提供宽大的感受野,同时保持 Voxel 表示的窄感受野,从而在提高性能的同时提升了计算效率。PQD引入了原型 Query 以加速解码过程。 场景自适应原型是从输入样本的三维 Voxel 特征中提取出来的,而场景无关原型则是在训练阶段通过将场景自适应原型应用于指数移动平均值计算得到的。 通过使用基于这些原型的 Query 来进行解码,作 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览