看啥推荐读物

专栏名称: GiantPandaCV

专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创，每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你，大家一起共同进步(･ω<)☆

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

新进展！Larimar-让大型语言模型像人一样记忆与遗忘

GiantPandaCV · 公众号 · 3D · 2024-03-26 21:39

新进展！Larimar-让大型语言模型像人一样记忆与遗忘1. 论文摘要更新大型语言模型（LLM）中的知识是当前研究的一个重要挑战。本文介绍了Larimar——一种受大脑启发的新架构，它通过分布式情节记忆来增强LLM。Larimar的记忆系统能够在不需要重新训练或微调的情况下，动态地进行一次性知识更新。在多个事实编辑基准测试中，Larimar展示了与最有竞争力的基线相当的精度，即使在连续编辑的挑战性环境中也是如此。它在速度上也超过了基线，根据不同的LLM，可以实现4到10倍的加速。此外，由于其架构的简单性、LLM不可知论和通用性，Larimar也展示出了灵活性。我们还提供了基于Larimar的一次性记忆更新机制，包括选择性事实遗忘和输入上下文长度的泛化机制，并证明了它们的有效性。论文标题：Larimar: Large Language Models with Episodic Memory Control论文链接：http ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博