今天看啥  ›  专栏  ›  HuggingFace

用于显著提高检索速度和降低成本的二进制和标量嵌入量化

HuggingFace  · 公众号  ·  · 2024-04-11 18:30
我们引入了嵌入量化的概念,并展示了它们对检索速度、内存使用、磁盘空间和成本的影响。我们将讨论理论上和实践中如何对嵌入进行量化,然后介绍一个 演示,展示了 4100 万维基百科文本的真实检索场景。演示地址https://hf.co/spaces/sentence-transformers/quantized-retrieval为什么使用嵌入?嵌入是自然语言处理中最多样化的工具之一,支持各种设置和使用场景。本质上,嵌入是对更复杂对象 (如文本、图像、音频等) 的数值表示。具体来说,这些对象被表示为 n 维向量。在转换了复杂对象之后,你可以通过计算相应嵌入的相似性来确定它们的相似性!这对于许多使用场景至关重要: 它为推荐系统、检索、单次学习或少样本学习、异常检测、相似性搜索、释义检测、聚类、分类等提供了基础。嵌入可能难以扩展但是,当我们在实际应用中使用嵌入时,可能会 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照