专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

科学家提出大模型微调新方法,效果优于现有大模型参数高效微调

DeepTech深科技  · 公众号  · 科技媒体  · 2024-07-19 19:01
    

文章预览

最近,美国斯坦福大学团队提出了一种基于大语言模型表征的微调新方法,名为 ReFT。 该方法通过训练干预模块对模型表征进行干预,从而达到训练的目标。 近日,相关论文以《ReFT:针对大语言模型基于表征的微调方法》( ReFT: Representation Finetuning for Language Models )为题,发表在预印本网站 arXiv  上[1]。 斯坦福大学博士研究生吴政璇和阿拉曼·阿罗拉(Araman Arora)是共同第一作者,克里斯多夫·波茨( Christopher Potts )教授担任通讯作者。 图丨相关论文(来源: arXiv ) 吴政璇是斯坦福大学自然语言处理组的博士研究生,该研究的设计思路来源于一次偶然的实验。 当时,他与两位合作者想确认一个猜想:能不能通过训练很小的表征干预模块,让大模型一直输出“Sorry, I don’t know”? 结果,他们在只改变线性子空间中的单个神经元的情况下,就做到 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览