看啥推荐读物
专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
今天看啥  ›  专栏  ›  待字闺中

通过合成数据提升LLMs:Orca2

待字闺中  · 公众号  · 程序员  · 2023-11-30 09:05
今年早些时候,微软研究院推出了Orca,这是一个具有130亿参数的模型,能够模仿其他大型语言模型所展现的复杂推理过程。具体来说,Orca从GPT-4的信号中学习,包括解释性追踪、一步步细致的思考过程,以及大量复杂的指令。就在几天前,微软在这一研究领域取得了进一步的发展,发布了Orca 2,这是对开创性工作的扩展,它更深入地探索了小型语言模型(SLMs)的领域。这一新版本挑战了传统的推理方法,推动了该领域可能性的边界。传统上,SLM的训练在很大程度上依赖于模仿学习,努力复制其更有名望对手的输出。然而,微软研究院认为,这种不懈的模仿强调可能无意中限制了这些小型模型的潜力。这里的目标是让小型LM能够采用多样的解决策略来处理各种任务,这些策略可能与它们更大的对手采取的路径有所不同。Orca 2的核心在于两项关键技术 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照