专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

Meta开发System 2蒸馏技术，Llama 2对话模型任务准确率接近100%

PaperWeekly · 公众号 · 科研 · 2024-07-16 23:02

文章预览

©作者 | 杜伟来源 | 机器之心谈到大语言模型（LLM）的策略，一般来说有两种，一种是即时的 System 1（快速反应），另一种是 System 2（慢速思考）。其中 System 2 推理倾向于深思熟虑的思维，生成中间思维允许模型（或人类）进行推理和规划，以便成功完成任务或响应指令。在 System 2 推理中，需要付出努力的心理活动，尤其是在 System 1（更自动化思维）可能出错的情况下。因此，System 1 被定义为 Transformer 的应用，可以根据输入直接生成响应，而无需生成中间 token。Sytem 2 被定义为生成中间 token 的任何方法，包括执行搜索或多次提示然后最终生成响应的方法。业界已经提出了一系列相关的 System 2 技术，包括思维链、思维树、思维图、分支解决合并、System 2 Attention、Rephrase and Respond (RaR) 等。得益于这种明确的推理，许多方法都显示出更准确的结 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

实验万事屋 · 看人家博士生做科研真是费劲！这中山大学第一附属医院的14.3分线粒体自噬的SCI文章，可还有那么点儿不足……

11 小时前

社会学研究杂志 · JCS 本刊论文 | 公共话语中的社会分层关注度——基于书籍大数据的实证分析（1949-2008）

2 天前

InfoQ · 全球超万亿使用量的热门数据库，首次被大模型揪出了严重漏洞

6 月前

梁中华宏观研究 · 财政加力：收支进一步改善——2024年12月财政数据点评（海通宏观侯欢、梁中华）

3 月前

国际旅游岛商报 · 中核集团回应“收到100多万份简历”

1 月前

掘金Liszt · 【定投指南】2025年4月14日

1 月前