专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
目录
相关文章推荐
今天看啥  ›  专栏  ›  我爱计算机视觉

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

我爱计算机视觉  · 公众号  ·  · 2025-04-08 21:00
    

文章预览

关注公众号,发现CV技术之美 本文转自机器之心。 本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。 相关论文 FoundationStereo: Zero-Shot Stereo Matching 获得 CVPR 2025 满分评审,代码已开源。 论文地址:https://arxiv.org/abs/2501.09898   项目主页:https://nvlabs.github.io/FoundationStereo/   项目代码和数据集:https://github.com/NVlabs/FoundationStereo/   对比常用 RGBD 相机: 目前 FoundationStereo 在 Middlebury, ETH3D 等多个排行榜位列第一。 引言 立体匹配算法虽在基准数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览