图像相似度对比，CLIP与DINOv2的深度分析

江大白 · 公众号 · · 2023-10-13 08:00

以下文章来源于知乎：DeepHub IMBA作者：DeepHub IMBA链接：https://mp.weixin.qq.com/s/rZAuY9tVWPjtVixqbJSu3A本文仅用于学术分享，如有侵权，请联系后台作删文处理导读图片相似度分析，在计算机视觉领域非常常用，比如人体检索、人体去重等。本文讲解两个非常好用的工具，CLIP和DINOv2。并全面探讨了CLIP和DINOv2的优势和它们之间微妙的差别，希望对大家学习有所帮助。在计算机视觉领域有两个主要的自监督模型:CLIP和DINOv2。CLIP彻底改变了图像理解并且成为图片和文字之间的桥梁，而DINOv2带来了一种新的自监督学习方法。在本文中，我们将探讨CLIP和DINOv2的优势和它们直接微妙的差别。我们的目标是发现哪些模型在图像相似任务中真正表现出色。CLIP使用CLIP计算两幅图像之间的相似性是一个简单的过程，只需两步即可实现:提取两幅图像的特征，然后计算它们的余弦 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博