今天看啥  ›  专栏  ›  机器之心

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

机器之心  · 公众号  · AI  · 2025-04-06 08:40
    

文章预览

本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。 相关论文 FoundationStereo: Zero-Shot Stereo Matching 获得 CVPR 2025 满分评审,代码已开源。 论文地址:https://arxiv.org/abs/2501.09898   项目主页:https://nvlabs.github.io/FoundationStereo/   项目代码和数据集:https://github.com/NVlabs/FoundationStereo/   对比常用 RGBD 相机: 目前 FoundationStereo 在 Middlebury, ETH3D 等多个排行榜位列第一。 引言 立体匹配算法虽在基准数据集上表现优异,但零样本泛化能力仍不足。现有 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览