今天看啥  ›  专栏  ›  包包算法笔记

RAG全链路的关键模块解析

包包算法笔记  · 公众号  ·  · 2024-04-06 22:29
原文:https://zhuanlan.zhihu.com/p/682253496整理:青稞AI1. 背景介绍RAG(Retrieval Augmented Generation,检索增强生成 )方法是指结合了基于检索的模型和生成模型的能力,以提高生成文本的质量和相关性。该方法是Meta在2020年发表的文章《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》[1]中提出的,该方法让LM(Language Model,语言模型)能够获取内化知识之外的信息,并允许LM在专业知识库的基础上,以更准确的方式回答问题。而在大模型时代,它更是用于解决幻觉问题、知识时效问题、超长文本问题等各种大模型本身制约或不足的必要技术。2. RAG的挑战RAG主要面临三个方面的挑战:检索质量、增强过程和生成质量。2.1 检索质量• 语义歧义:向量表示(例如词嵌入)可能无法捕捉概念之间的细微差别。例如,“苹果”一词可能指的是水果或科技公司。嵌入 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照