看啥推荐读物

专栏名称: 老刘说NLP

老刘，NLP开源爱好者与践行者。主页：https://liuhuanyong.github.io。老刘说NLP，将定期发布语言资源、工程实践、技术总结等内容，欢迎关注。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

多模态大模型到底理不理解文档图表？兼谈RAG如何解决全局摘要问答类问题

老刘说NLP · 公众号 · · 2024-04-27 18:33

今天是2024年4月27日，星期六，单休，北京，天气阴。今天我们来谈谈2个问题，一个是RAG如何应用于全局摘要问答类问题，另一个是最近所关注的图表理解问题，尤其是图表信息抽取，引发了关于大模型是否真正理解图表的疑问，大家可以看看。问题1：RAG如何应用于全局摘要问答类问题我们先来看一类问题，RAG无法回答针对整个文本语料库的全局性问题，例如"数据集中的主要主题是什么？"，因为这本质上是一个以查询为重点的摘要（QFS）任务，而不是一个明确的检索任务。很自然的，这类问题，我们实现做多个聚类，然后建立索引，最后根据query，找到对应的若干个聚类文本，最终再做summary合并即可。因此，这就涉及到聚类的实现以及类簇的选择两个问题。《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》(https://arxiv.org/pdf/2404.16130) 这 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博