今天看啥  ›  专栏  ›  3D视觉之心

速度提升10倍以上!Depth Anything V2:更稳健、精细的单目深度估计(HKU&TikT...

3D视觉之心  · 公众号  ·  · 2024-06-16 07:00
    

文章预览

点击下方 卡片 ,关注“ 3D视觉之心 ”公众号 第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群 本文介绍了Depth Anything V2。不追求花哨的技术,而是旨在揭示关键发现,为构建强大的单目深度估计模型铺平道路。值得注意的是,与V1相比,本版本通过三项关键实践产生了更精细、更稳健的深度预测:1) 将所有带标签的真实图像替换为合成图像;2) 扩大教师模型的容量;3) 通过大规模伪标签真实图像的桥梁来教授学生模型。与基于Stable Diffusion的最新模型相比,我们的模型在效率(速度快10倍以上)和准确性上都显著提高。我们提供了不同规模(参数范围从25M到1.3B)的模型,以支持广泛的场景。得益于它们强大的泛化能力,我们使用度量深度标签对其进行微调,以获得我们的度量深度模型。除了我们的模型外,考虑到当前测试集的有限多 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览