今天看啥  ›  专栏  ›  字节跳动技术团队

向量检索能力SOTA,字节Seed1.5-Embedding模型训练细节公开

字节跳动技术团队  · 公众号  ·  · 2025-05-13 17:31
    

文章预览

字节跳动 Seed 团队最新向量模型 Seed1.5-Embedding 公布技术细节,该模型基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。在权威测评榜单 MTEB 上,Seed1.5-Embedding 达到了中英文 SOTA 效果。除了通用 Embedding 任务外,团队还额外优化了模型在推理密集的检索任务上的能力,并在对应榜单 BRIGHT 上也达到 SOTA。 团队认为,Seed1.5-Embedding 可作为搜索任务中的关键组件,高质量地将用户输入文本、文档信息转换为向量并建立匹配关系。该模型 API 接口将于近期在火山方舟平台开放,欢迎保持关注: HuggingFace:   https://huggingface.co/ByteDance-Seed/Seed1.5-Embedding 向量模型(Embedding Model)可将输入文本的语义编码到高维空间的表征向量中,使得相关文本之间的向量相似度更高,能够支撑检索、分类、聚类等各项下游任务,从而在搜索、推荐、内容理解等场景中被广泛应用。 随着大模型 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览