注册登录

看啥推荐读物

专栏名称: 数据派THU

本订阅号是“THU数据派”的姊妹账号，致力于传播大数据价值、培养数据思维。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

软件定义世界（SDX） · 央企数字化转型最新进展和最新实践经验· 4 天前

数据派THU · 基于深度学习的中文文本分类综述· 4 天前

大数据文摘 · 中国人形机器人学会跑酷，跳上40公分高台，深 ...· 6 天前

数据派THU · 【ICML2024】超图增强的双半监督图分类· 6 天前

艺恩数据 · 为什么是微短剧接住了这波流量密码？· 6 天前

今天看啥 › 专栏 › 数据派THU

【CVPR2024】探索视觉基础模型的三维感知能力

数据派THU · 公众号 · 大数据 · 2024-04-28 17:00

来源：专知本文为论文介绍，建议阅读5分钟在这项工作中，我们分析了视觉基础模型的三维感知能力。近期在大规模预训练领域的进展已经催生了具有强大能力的视觉基础模型。这些模型不仅能够将训练任务泛化到任意图像，其中间表示也对其他视觉任务如检测和分割非常有用。鉴于这样的模型可以在2D中分类、勾画和定位对象，我们提出一个问题：它们是否也能表征对象的3D结构？在这项工作中，我们分析了视觉基础模型的三维感知能力。我们认为，三维感知意味着表示能（1）编码场景的三维结构；（2）在不同视图中一致地表征表面。我们使用任务特定的探针和冻结特征上的零样本推理流程进行了一系列实验。我们的实验揭示了当前模型的几个限制。我们的代码和分析可以在 https://github.com/mbanani/probe3d 找到。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

软件定义世界（SDX） · 央企数字化转型最新进展和最新实践经验

4 天前

数据派THU · 基于深度学习的中文文本分类综述

4 天前

大数据文摘 · 中国人形机器人学会跑酷，跳上40公分高台，深度学习技术是关键

6 天前

数据派THU · 【ICML2024】超图增强的双半监督图分类

6 天前

艺恩数据 · 为什么是微短剧接住了这波流量密码？

6 天前

香樟经济学术圈 · 【香樟推文3019】在众筹中通过定价披露产品质量信息

6 月前

HR人力资源管理 · 明年，你凭什么在单位立足？（此文已火）

1 年前

中核集团 · 党史学习教育丨中核人说党史⑨周总理与《我的修养要则》

2 年前

防骗大数据 · 防骗 | 刷单即可月入过万？天上会掉馅饼？你可别当骗子帮凶！

4 年前

CITICS电子研究 · 【中信证券电子研究】舜宇光学科技（02382.HK）2020年3月出货量数据点评：3月数据表现优异，二季度需求或短期承压

4 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号