专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

LLM对齐数据全自动合成！UW华人博士生提出Magpie方法，Macbook Air即可运行

新智元 · 公众号 · AI · 2024-07-26 11:22

文章预览

新智元报道编辑：乔杨【新智元导读】华盛顿大学和Allen AI最近发表的论文提出了一种新颖有趣的数据合成方法。他们发现，充分利用LLM的自回归特性，可以引导模型自动生成高质量的指令微调数据。数据对LLM训练而言是至关重要的存在，但我们的关注点往往放在训练和评估数据，而会忽略微调数据。比如Llama系列模型，虽然开放了权重（如Llama-3-Instruct），但微调数据集依旧是私有的。 LLM的成功有很大一部分取决于指令微调（instruction fine-tuning），这个过程能让模型更好地泛化到训练过程中没有接触过的任务。正如训练的有效性依赖于训练语料的质量，指令微调的有效性也取决于能否获得高质量的指令数据集。然而，相比于无标注的自监督训练语料，高质量微调和对齐数据集更加难以构建、扩展，因为需要更多人工标注，而且存在预先 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 本文通过在特定的图连通性推理任务上的理论分析和实验验证，有力地证-20250530054732

昨天

爱可可-爱生活 · 【[183星]microsandbox：为不信任的用户代码或AI-20250529221032

昨天

爱可可-爱生活 · 本文颠覆性地指出传统马尔可夫强化学习无法有效支持LLM在测试时进-20250529054027

2 天前

爱可可-爱生活 · 晚安～ #晚安# -20250528231813

2 天前

黄建同学 · 厉害了！最近，安全研究员 Sean Heelan 在其博客中分享-20250528181015

2 天前

医美行业观察 · 做医美，来美医会！全产业链数据库精准对接

10 月前

体外诊断价值圈 · 1元！三级医院试剂、耗材SPD

4 月前

今日闵行 · 闵行“顶流”赏花景点火了，200多个品种月季花，百米花墙……

4 周前