以下文章来源于知乎:DeepHub IMBA作者:DeepHub IMBA链接:https://mp.weixin.qq.com/s/rZAuY9tVWPjtVixqbJSu3A本文仅用于学术分享,如有侵权,请联系后台作删文处理导读图片相似度分析,在计算机视觉领域非常常用,比如人体检索、人体去重等。本文讲解两个非常好用的工具,CLIP和DINOv2。并全面探讨了CLIP和DINOv2的优势和它们之间微妙的差别,希望对大家学习有所帮助。在计算机视觉领域有两个主要的自监督模型:CLIP和DINOv2。CLIP彻底改变了图像理解并且成为图片和文字之间的桥梁,而DINOv2带来了一种新的自监督学习方法。在本文中,我们将探讨CLIP和DINOv2的优势和它们直接微妙的差别。我们的目标是发现哪些模型在图像相似任务中真正表现出色。CLIP使用CLIP计算两幅图像之间的相似性是一个简单的过程,只需两步即可实现:提取两幅图像的特征,然后计算它们的余弦
………………………………