专栏名称: 深度学习与NLP
专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。
目录
今天看啥  ›  专栏  ›  深度学习与NLP

又快又准的RAG Meta-Chunking,1.3倍提升,耗时减半

深度学习与NLP  · 公众号  ·  · 2024-10-21 00:00
    

文章预览

RAG效果在很大程度上依赖于检索到的文档的相关性和准确性。传统的基于规则或语义相似性的文本分块方法在捕捉句子间微妙的逻辑关系上存在不足。 RAG流水线的概览,以及基于规则、相似性和PPL分割的示例。相同的背景色表示位于同一个块中。  为了解决现有方法的局限性,提出了一种名为 Meta-Chunking 的概念,它在句子和段落之间定义了一种粒度: 由段落内具有深层语言逻辑联系的句子集合组成 ,旨在增强文本分割过程中的逻辑连贯性。Meta-Chunking包括基于LLMs的两种策略: 边际采样分块 (Margin Sampling Chunking)和 困惑度分块 (Perplexity Chunking)。 整个元块分割(Meta-Chunking)过程的概览 。每个圆圈代表一个完整的句子,句子的长度并不一致。垂直线表示在哪里进行分割。图底部的两侧揭示了边缘采样分割(Margin Sampling Chunking)和困惑度分割(Per ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览