看啥推荐读物
专栏名称: 小白学视觉
本公众号主要介绍机器视觉基础知识和新闻,以及在学习机器视觉时遇到的各种纠结和坑的心路历程。
今天看啥  ›  专栏  ›  小白学视觉

CVPR 2024 | 视觉新突破!首个无自然语言的纯视觉大模型!

小白学视觉  · 公众号  ·  · 2024-04-14 10:10
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨机器之心来源丨机器之心编辑丨极市平台极市导读 仅靠视觉(像素)模型能走多远?UC 伯克利、约翰霍普金斯大学的新论文探讨了这一问题,并展示了大型视觉模型(LVM)在多种 CV 任务上的应用潜力。 最近一段时间以来,GPT 和 LLaMA 等大型语言模型 (LLM) 已经风靡全球。另一个关注度同样很高的问题是,如果想要构建大型视觉模型 (LVM) ,我们需要的是什么?LLaVA 等视觉语言模型所提供的思路很有趣,也值得探索,但根据动物界的规律,我们已经知道视觉能力和语言能力二者并不相关。比如许多实验都表明,非人类灵长类动物的视觉世界与人类的视觉世界非常相似,尽管它们和人类的语言体系「两模两样」。在最近一篇论文中,UC 伯克利和约翰霍普金斯大学的研究 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照