文章预览
关注公众号,发现CV技术之美 本文转自机器之心。 本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。 相关论文 FoundationStereo: Zero-Shot Stereo Matching 获得 CVPR 2025 满分评审,代码已开源。 论文地址:https://arxiv.org/abs/2501.09898 项目主页:https://nvlabs.github.io/FoundationStereo/ 项目代码和数据集:https://github.com/NVlabs/FoundationStereo/ 对比常用 RGBD 相机: 目前 FoundationStereo 在 Middlebury, ETH3D 等多个排行榜位列第一。 引言 立体匹配算法虽在基准数
………………………………